quarta-feira, 25 de junho de 2025

DECOMPOR +

Fiz uma atualização de código no Dicionário Ganbarou Ze! ontem. Trata-se da inclusão da funcionalidade “Decompor +”. Para entender essa nova funcionalidade, usemos como exemplo a palavra “脳室周囲白質軟化症”. Se a decompormos e selecionarmos a tag “Sugestão”, teremos:

image

Como o foco da funcionalidade de decomposição é fazer com que o usuário enxergue as palavras mais simples dentro de palavras mais complexas, o que facilita a associação e memorização, perceba na imagem acima que a palavra 軟化症 pode ser decomposta também. Nestes casos, o botão “Decompor +” aparecerá perto das tags de relevância:

image

Ao clicar no botão “Decompor +”, teremos “em tempo real” a decomposição de 軟化症:

image

Com isso, creio que conseguimos chegar às palavras mais simples possíveis dentro de uma determinada palavra complexa, o que, de novo, facilita a associação e a memorização, além de fazer com que palavras mais longas não pareçam como monstros intimidadores.

Tenho mais ideias de funcionalidades a disponibilizar no Dicionário Ganbarou Ze!, mas prefiro não dizer quais são. Prefiro tão somente disponilizá-las e ponto final. Promessas NUNCA acabaram bem nesses mais de 10 anos de projeto (infelizmente).

domingo, 22 de junho de 2025

MECAB “MADE IN BRASIL”

Em poucas palavras e de forma simplista, o Mecab é um código que decompõe palavras japonesas em palavras menores, o que facilita visualizar os elementos constituintes de uma palavra.

Essa semana eu pensei:

“Ah, se o Dicionário Ganbarou Ze! tem a funcionalidade de decompor palavras, por que não adicionar uma lógica ao seu código para que ele tente “adivinhar” quais são os elementos que formam a palavra pesquisada? Tipo um Mecab da vida…”

Como não sou programador e não tenho uma equipe de programadores humanos, pedi ao meu “programador virtual” (ChatGPT) [é o que temos para hoje!] que colocasse essa ideia em prática. Então, nós dois criamos a tag “sugestão”, que aparecerá quando uma decomposição (automática ou manual) for executada.

image

Ao selecionar a tag “Sugestão”, o Dicionário Ganbarou Ze! apresentará a provável formação da palavra pesquisada. Como exemplo, peguemos a palavra “大使級会談”, que em breve constará na nossa base de dados. Como ela não consta ainda na base de dados, ela será decomposta automaticamente, sendo exibidos 68 registros. Ao selecionar a tag “Sugestão”, teremos:

image

Aliás, se fôssemos decompor “大使級会談” no Mecab, teríamos o mesmo resultado:

image

E a vantagem do nosso (meu e do ChatGPT) Mecab “Made In BraSil” é que, talvez, ele lide melhor com nomes do que o próprio Mecab! Afinal, “nosso código, nossa lógica!”. Peguemos como exemplo o nome da idol Kiara Saitou (齋藤樹愛羅) do grupo =LOVE. Ao selecionar as tags “Sugestão” e “G0 (nome)”, temos:

image

Veja como o Mecab decompõe o mesmo nome:

image

Esta é uma das vantagens de se ter um código próprio. É fazer o mesmo que os outros fizeram, mas também fazer o que os outros não fizeram – ou seja, aprimorar! É claro que o código ainda pode ser melhorado quanto à lógica, mas com certeza eu farei isso quando achar necessário.

Acho que agora podemos dizer que pela primeira vez temos um Mecab brasileiro. Um Mecab “made in BraSil by projeto Ganbarou Ze!”.

terça-feira, 17 de junho de 2025

ATUALIZAÇÃO NA DECOMPOSIÇÃO AUTOMÁTICA

Acabei de atualizar o código do Dicionário Ganbarou Ze! Desta vez, quando uma palavra não for encontrada e a opção “decompor” for acionada automaticamente (e somente neste caso), os resultados serão exibidos com uma caixa de seleção de acordo com a relevância dos itens encontrados:

image

Dessa forma, o usuário poderá escolher quais itens quer que sejam exibidos. Creio que isso facilitará a análise da palavra decomposta.

segunda-feira, 9 de junho de 2025

CÓDIGO DO DICIONÁRIO ATUALIZADO

Acabei de atualizar o código do Dicionário Ganbarou Ze! acrescentando uma nova funcionalidade.

Agora, se uma palavra não é encontrada, ela é automaticamente decomposta para que, pelo menos, o internauta tenha uma ideia do seu significado até que eu a inclua na base de dados.

Essa função de decomposição automática quando uma palavra não é encontrada é útil tendo em vista que, ao se deparar com uma palavra desconhecida, o internauta pode estar diante de um NOME. Portanto, a decomposição automática inclui a base de dados de nomes!

Observe o exemplo com “諫山創”. Ela não consta na base de dados e, portanto, a função de decomposição automática é ativada:
 

image

Logo em seguida, os resultados são mostrados incluindo a base de dados de NOMES:

image

Aliás, veja que neste exemplo logo na primeira página já aparece o sobrenome “Isayama”. Se você é fã de Ataque de Titãs, já deve imaginar que “諫山創” se trata de “Isayama Hajime”, autor do mangá:

image

Enfim, com esta nova funcionalidade acredito que pouparemos tempo, bem como, ao pesquisar por nomes (inteiros) pensando que são palavras, teremos alguma resposta do dicionário (afinal nomes e palavras japonesas comuns podem ser facilmente confundidos).

domingo, 1 de junho de 2025

MAIS DE 1 MILHÃO DE PALAVRAS!!!

Hoje finalmente conseguimos ultrapassar a marca de 1 milhão de palavras no Dicionário Ganbarou Ze!.

image

Certamente, esta é uma marca importante, pois é a primeira vez que nós brasileiros temos um dicionário de japonês com essa quantidade de palavras! Além disso, o Dicionário Ganbarou Ze! possui uma das maiores bases de sentenças bilíngues (e talvez a MAIOR).

Isso não deixa de ser também uma grande alegria pessoal para mim, Nelson. Alcancei essas marcas dedicando horas e horas diárias neste trabalho solitário. Isso é uma amostra do que sou capaz e um sinal de que tudo isso vale a pena por aqueles poucos (considerando o nicho como um todo) que me enviam mensagens de apoio e que tiveram suas vidas transformadas por este projeto (o que contribui para a seção “Como Aprender?).

E é claro que continuarei atualizando as bases de dados. Faltam ainda cerca de 50.000 palavras para termos finalmente todo o projeto EDICT em português. E lembrando que geralmente aos domingos acrescento também as palavras novas do projeto EDICT da respectiva semana.

quinta-feira, 1 de maio de 2025

UMA CRÍTICA AO PROJETO EDICT

Faltam menos de 100.000 palavras para que eu termine de traduzir e revisar TODAS as palavras que constam no projeto EDICT, a base de muitos dicionários Japonês-Inglês disponíveis na internet. Parece muito, mas não é, já que a base tem mais de 300.000 palavras, e estou fazendo isso sozinho.

Na verdade, posso dizer que, com a ajuda de diversos scripts, as palavras que faltam já estão traduzidas, e o que estou fazendo é uma REVISÃO de tradução. O que tem dificultado esse processo é, infelizmente, a qualidade das tradução de muitas palavras.

Um exemplo é a palavra “プレイリーダー”, que é traduzida para o inglês como “playreader”, que significa “aquele que lê peças em manuscrito e recomenda sua aceitação ou rejeição”. O grande problema aqui é que o termo “リーダー” pode tanto se referir à palavra inglesa “reader” (leitor) como “leader” (líder), e em japonês eu só encontrei para “プレイリーダー” o significado de “pessoa que ajuda as crianças a brincar animadamente no parque infantil e cria um ambiente propício para isso”.

Percebe?

A palavra “プレイリーダー” realmente existe no japonês, mas NÃO significa em inglês “playreader”, mas sim “play leader”, no sentido de um “líder de brincadeiras”. Além disso, não encontrei registros de “playleader” em inglês como palavra única, o que me faz imaginar que “プレイリーダー” seja uma palavra que usa elementos da língua inglesa, mas que tem sentido próprio no Japão. Seria como o nosso “shopping”: nós brasileiros usamos essa palavra inglesa para indicar o lugar fechado e cheio de lojas variadas,  mas se quisermos expressar o mesmo conceito de modo que um falante nativo do inglês entenda, temos que usar “mall”.

Além disso, muitas palavras do projeto EDICT estão com a transcrição direta para o inglês apenas. Por exemplo “ナックルフォア” é traduzido como “knuckle four”, o que está correto. Entretanto, ao que parece “ナックルフォア” é mais um exemplo de palavra com elementos da língua inglesa, mas com sentido próprio no Japão apenas. Sendo assim, penso que deveria haver uma explicação da palavra e não apenas uma transcrição direta para o inglês.

Enfim, por essas razões, o processo de revisão das palavras está um pouco mais demorado do que eu imaginava. Ora, se a tradução em inglês deixa a desejar em muitos casos, a tradução do inglês para o português não poderia ser diferente.

sábado, 26 de abril de 2025

PAPA FRANCISCO

Adicionei à base de dados “Sentenças” do Dicionário Ganbarou Ze!! algumas notícias recentes referentes ao Papa Francisco. As noticias foram retiradas do site Vatican News em sua versão em japonês.

image