Boa tarde, pessoal.
Preciso organizar dados provenientes de um arquivo no formato PDF.
Copiei e colei os dados para uma planilha do LibreOffice Calc (aproximadamente 20 mil linhas).
O objetivo é obter três outras colunas, uma com o valor do lote, uma com o peso do lote e uma com o código do lote.
Para obter o valor do lote eu coloquei o $ como separador de colunas na hora de colar, então o número que estava após o $ foi separado em outra coluna, mas não estou conseguindo extrair a informação do peso do lote, pois ela está dentro de um texto. Também não consigo extrair o código do lote.
Abaixo vou colar um extrato da tabela contendo apenas 3 itens, cada item pode ter de 5 a 7 linhas, dependendo do tamanho da descrição:
0453.000001-9
0453.213.00000211-7
TRES ANÉIS, DE: OURO; CONTÉM: pedras; CONSTAM: amolgada(s), PESO LOTE:
10,43G (DEZ GRAMAS E QUARENTA E TRES CENTIGRAMAS)
R$ 623,00
0453.000002-7
0453.213.00001127-2
UMA ALIANÇA, UM ANEL, QUATRO BRINCOS, DE: OURO; CONSTAM:
amolgada(s), amassada(s), iniciais, inscrições, PESO LOTE: 5,20G (CINCO
GRAMAS E VINTE CENTIGRAMAS)
R$ 216,00
0453.000003-5
0453.213.00001223-6
UM COLAR, UMA PULSEIRA, DE: OURO BRANCO, OURO, PESO LOTE: 10,30G
(DEZ GRAMAS E TRINTA CENTIGRAMAS)
R$ 536,00
Se puderem me dar uma luz de como posso fazer isso seria ótimo.
Desde já, obrigado pela atenção.