Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Função cut_text em parse_dje_tjsp retorna N.A em alguns casos. #2

Open
GigioR opened this issue May 14, 2018 · 1 comment
Open

Função cut_text em parse_dje_tjsp retorna N.A em alguns casos. #2

GigioR opened this issue May 14, 2018 · 1 comment

Comments

@GigioR
Copy link
Collaborator

GigioR commented May 14, 2018

A função cut_text dentro da função parse_dje_tjsp está retornando valores nulos para alguns casos.
O diário de justiça eletrônico (dje) usado foi do dia 02/10/2017, caderno 18, do TJSP, e os valores nules são os dos Distribuidores Criminais das cidades de Brodowski e Descalvado.

[...]
            lim_inf <- text %>%
            break_text(y$valor[distribuidor[i]])
          points <- text %>%
            stringr::str_sub(lim_inf, -1) %>%
            break_text(y$valor[distribuidor[i]:(distribuidor[i]+1)])
          r[i] <- stringr::str_sub(stringr::str_sub(text, lim_inf, -1),
                                   points[1], points[2])

[...]

O trecho de código acima é possivelmente onde está o erro que faz retornar valores nulos.
Em distribuidor[i] tem um valor mas em distribuidor[i] +1 não tem valor, fazendo com que points só tenha uma posição, que é a points[1]. Como points[2] não tem valor, r[i] é nulo.
r[i] é o texto com todos os processos do Distribuidor da iteração.
points[1] é o nome do Distribuidor e points[2] é o próximo ponto a ser analisado para retornar o valor em r[i].

Passando por parâmetro a posição 21 da variável breaks teremos:
Saída de points[1]: "\nDistribuidor Criminal\n"
Saída de points[2]: "\n2° Vara\n"

O caso acima é um caso de sucesso.

Passando por parâmetro a posição 28 da variável breaks teremos:
Saída de points[1]: "\nDistribuidor Criminal\n"
Saída de points[2]: "\nNA\n"

O caso acima é um caso de falha.

É complicado explicar o erro que existe nessa função. Mas no geral, a função gera um data_frame de processos separados por cidades e distribuidores (Cívil ou Criminal) e com esse erro faltam aproximadamente 20 processos numa tabela com mais de 6500 processos.

@GigioR
Copy link
Collaborator Author

GigioR commented May 15, 2018

Correção: os valores que estão sendo retornados não são valores nulos, são valores omissos.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant