Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Script para ler e processar planilha de páginas mais acessadas #46

Open
rffontenelle opened this issue Jun 15, 2021 · 14 comments
Open

Comments

@rffontenelle
Copy link
Collaborator

Criar um script que leia planilhas como a relacionada abaixo, processe-a e emita uma lista de prioridades de tradução.

https://docs.google.com/spreadsheets/d/1RJapw9QAoLcdSV6et9G67LNTM3Pcn6XIv_h5S5ksFNk/edit?usp=sharing

A planilha acima apresenta as páginas mais requisitadas da documentação do Python no Brasil.

Conteúdo desejável da lista de prioridades:

  • nome do recursos (ex., library--datetime)
  • URL para tradução no Transifex)
  • (URL da documentação?)

Por exemplo: A URL https://docs.python.org/3/library/datetime.html resultaria no recurso de Transifex "library--datetime" ("/" substituída por "--", prefixo e extensão removida), resultando na URL para tradução: https://www.transifex.com/python-doc/python-39/translate/#pt_BR/library--datetime

Na URL para tradução, a parte "python-39" é o nome do projeto, composto de python-VERSÃO (VERSÃO retirado o ponto, 27, 39, 310). A versão pode ser atualizada, de forma que ser uma variável ajustável pode ser interessante.

@adorilson
Copy link
Contributor

Acho que para a maioria dos casos, especialmente o que está abaixo de /library, isso se aplica bem.

Para para algumas seções, como /tutorial, as páginas poderiam ser agrupadas. Faz mais sentido dizer que o tutorial é prioridade do que um capítulo específico dele. Não tenho certeza se outra seção se encaixa nisso ou apenas o tutorial.

@fecaridade
Copy link

fecaridade commented Jun 17, 2021

o link da linha 545 está quebrado dentro da planilha. @rffontenelle pode dar uma olhadinha?

image

@rougeth
Copy link
Collaborator

rougeth commented Jun 17, 2021

Corrigido @fecaridade

@fecaridade
Copy link

Obrigado!.

@adorilson
Copy link
Contributor

@rougeth Qual é o formato original dessa planilha? É um arquivo CSV? É Planilha Google mesmo? Outro? Se não for a Planilha Google, poderia compartilhar aqui?

@rougeth
Copy link
Collaborator

rougeth commented Jun 19, 2021 via email

@rffontenelle
Copy link
Collaborator Author

@adorilson considerando que dificilmente nova versão aparece e a aparente falta de padrão do arquivo, talvez não compense um script. O que acha?

@adorilson
Copy link
Contributor

@adorilson considerando que dificilmente nova versão aparece e a aparente falta de padrão do arquivo, talvez não compense um script. O que acha?

Acho que vale. Discutindo com Caridade, uma ideia foi o script pegar a porcentagem da tradução no Transifex e só mostrar o que tá com menos de 100%.

Mas bom mesmo era ver o PR, né?

@fecaridade compareça.

@fecaridade
Copy link

se for para fazer o script que pega a porcentagem da tradução do Transifex e mostrar o que estão com menos de 100% eu consigo criar o script
@adorilson apareci :)

@adorilson
Copy link
Contributor

se for para fazer o script que pega a porcentagem da tradução do Transifex e mostrar o que estão com menos de 100% eu consigo criar o script @adorilson apareci :)

Faz o PR com o que você já tem (isso é comparecer, não aparecer. :p )

E implementa essa questão aí das porcentagens de tradução.

@guilhermesrc
Copy link

Isso ainda é uma coisa a ser feita?

@adorilson
Copy link
Contributor

Isso ainda é uma coisa a ser feita?

Embora as páginas mais acessadas (top 10, talvez 20) já estejam traduzidas,
eu acredito que sim.

@fecaridade Ainda tem esse código aí para não (re)começarmos isso do zero?

@fecaridade
Copy link

@adorilson estou procurando aqui o código, colocarei no repositorio assim que encontrar!.

@fecaridade
Copy link

Olá @adorilson e @rffontenelle,

Encontrei meu script de 2021 no repositório github. No entanto, notei que ainda precisa passar por uma refatoração e corrigir alguns links.

O script atual é capaz de gerar links no formato da Transifex, mas ainda há algumas funcionalidades que precisam ser aprimoradas:

  • tornar a versão do link ajustável
  • lidar com links que estão fora do padrão, como os links "dev"
  • melhorar a abordagem para obter o nome da biblioteca e construir o link

Se tiverem sugestões ou preferências específicas, por favor, compartilhem!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants