quinta-feira, 2 de julho de 2026

O ÁPICE DO FURIGANBAROU? – PARTE 2

Nesta semana, o FuriGanbarou! passou por mais uma rodada de atualizações, na qual corrigi alguns bugs e melhorei o motor de segmentação.

Sim, talvez muitos de vocês podem ter pensado que eu usei algum segmentador conhecido no FuriGanbarou! (como Kuromoji, Mecab, etc.), mas NÃO é o caso. Com a ajuda dos meus “programadores virtuais”, o segmentador do FuriGanbarou! foi 100% criado do zero!

O motivo disso é que os segmentadores mais conhecidos NÃO são atualizados há muito tempo e isso é algo que me chateia demais. Então, preferi criar um segmentador “do zero” para que eu pudesse ter controle total sobre o código e possa mantê-lo sempre atualizado.

Considerando que eu consegui compilar uma versão do UNIDIC, o dicionário morfológico considerado muito mais preciso do que o IPADIC, posso dizer que o FurGanbarou! é o injetor/editor de furiganas mais moderno e avançado que existe, até por que é totalmente integrado às atualizações DIÁRIAS do EDICT/ENAMDICT, sendo pioneiro neste aspecto.

Como eu disse na postagem anterior, o FuriGanbarou! funciona basicamente assim:

(1) Segmentação através de um segmentador totalmente autoral que usa o UNIDIC(2) Revisão e correção através das bases atualizadas diariamente do EDICT/ENAMDICT

Um exemplo do EDICT/ENAMDICT revisando e corrigindo a segmentação do FuriGanbarou! é o sufixo 期生, que entrou na base do EDICT/ENAMDICT  na atualização de HOJE, 02/07/2026: até ontem o FuriGanbarou segmentava como 期[き]生[せい], mas partir de hoje já segmenta 期生[きせい] com classe gramatical “sufixo”.

Eu até pensei em tornar público o código do FuriGanbarou! para facilitar a detecção e correção de bugs, bem como a implementação de melhorias.

Mas vocês já sabem...

Acho que é muito mais fácil acontecer um MILAGRE e eu largar as muletas do que alguém deste nicho deserto e parasita colaborar de fato para alguma coisa neste projeto. Existe o GitHub, mas como eu sempre digo: quero preservar a identidade BRASILEIRA do projeto para que ele seja uma porta para oportunidades PARA BRASILEIROS (descendentes ou não).

Como eu sempre digo também, eu fico muito incomodado com o fato de o Brasil ter a maior população japonesa fora do Japão, mas NÃO ter as ferramentas mais inovadoras com relação ao ensino da língua japonesa (aliás, onde estão os frutos dos muitos falastrões autonomeados “especialistas de Japão” que existem na internet???). E me incomoda também o certo desprezo ao Brasil que há por parte dos japoneses, à pátria que os acolheu e lhes deu muitas oportunidades. Eu fico até irritado quando vejo criadores de conteúdo japoneses agindo como se o mundo se resumisse a Europa e Estados Unidos. Eu costumo entrar em contato com TODOS eles falando da importância que o Brasil teve e tem para os japoneses, mas sem sucesso.

Agora quando é pra caçar likes para ostentar grande número de seguidores e forte engajamento (e atrair patrocínios e participação em eventos) às custas dos brasileiros sem dar aos BRASILEIROS retorno real e proporcional…

Bom… deixemos isso pra lá…Smile with tongue out

domingo, 21 de junho de 2026

O ÁPICE DO FURIGANBAROU?

Depois de mais de 2 meses do lançamento do FuriGanbarou! e muitos ajustes posso dizer que estou muito feliz com o resultado. Ainda mais por que nesta semana, depois de muita pesquisa e conversa com meus “programadores virtuais”, diria que conquistei meu MAIOR objetivo para o Furiganbarou!: usar como dicionário de segmentação o UNIDIC!!!

Eu não sou programador e, portanto, sou leigo no assunto. Contudo, de forma simplista, segmentadores de textos japoneses usam lógica e um dicionário morfológico, que possuem a palavra, a leitura, a classe gramatical e o “custo de conexão”, que seria, novamente de forma simplista, uma probabilidade que indica a quais palavras uma determinada palavra tende a se conectar com mais frequência considerando o contexto. Até onde eu entendi sobre o assunto, esse custo de conexão é obtido pela análise de banco de dados de sentenças.

Nenhum dicionário morfológico acertará TUDO obviamente, pois estamos falando de probabilidades. Porém, existem dicionários mais precisos e menos precisos. E quanto mais precisos forem, mais pesados eles tendem a ser obviamente. Esse é o caso do UNIDIC: ele é talvez o dicionário morfológico mais preciso que existe atualmente, mas essa precisão tem um preço, que é o tamanho da sua, digamos, lógica de cálculo de custos de conexão.

Por isso mesmo, a maioria dos segmentadores usam o IPADIC, um dicionário morfológico leve, com um nível de precisão aceitável, mas que não é atualizado oficialmente desde 2007. O que mais me incomoda com relação ao IPADIC é justamente o fato de ele estar abandonado oficialmente falando. Por essa razão, ao criar o FuriGanbarou!, eu quis compensar essa desatualização do IPADIC com o EDICT/EMANDICT e o KANJIDIC. Por conta disso, o FuriGanbarou tem uma lógica complexa para um princípio simples:

“O EDICT/EMANDICT/KANJIDIC, por terem bases mais recentes, são os revisores do trabalho do segmentador com o IPADIC”

Isso parece simples, mas nesses dois meses fui me convencendo de que há muitas incoerências no tratamento de dados por parte do IPADIC, o que estava exigindo de mim criar mais e mais lógicas de revisão e correção e cada vez mais complexas. Só para ter uma ideia, atualmente o FuriGanbarou! tem mais de 20.000 linhas de código! Para um trabalho solitário de quem não é programador profissional, isso parecia não ter fim.

O fato de conseguir finalmente compilar o UNIDIC para usá-lo com o FuriGanbarou! é uma grande conquista, pois agora temos um dicionário morfológico mais recente e mais preciso (com cerca de 800.000 palavras), sem contar o código robusto de revisão e correção por meio do EDICT/EMANDICT/KANJIDIC (com mais de 1 milhão de entradas).

Dito isso, o FuriGanbarou! não é apenas mais um simples injetor de furiganas, mas é também um EDITOR AVANÇADO de furiganas que usa as bases mais recentes e mais precisas possíveis. É uma ferramenta ÚNICA no Brasil e talvez no MUNDO considerando o conjunto. E é uma ferramenta gratuita e BRASILEIRA!

Ah, e agora é possível copiar o texto com furiganas em cima do texto:

カーボベルデ出身しゅっしんのゴールキーパー、ヴォジーニャは40歳よんじゅうさいで、ありないとおもわれていた軌道きどう壮大そうだいゆめ実現じつげんしようとしている。= O goleiro Vozinha, originário de Cabo Verde, tem 40 anos e está prestes a realizar um grande sonho em uma trajetória que parecia impossível.

quarta-feira, 27 de maio de 2026

12 ANOS DE PROJETO GANBAROU ZE!

Ontem, o Projeto Ganbarou Ze! completou 12 anos. Parece que foi ontem que coloquei no ar o blogue estando cheio de expectavas e desejando criar a maior comunidade colaborativa sobre língua japonesa do Brasil e quem sabe do mundo, dado o grande potencial criativo e de alcance que nós brasileiros temos. E confesso que o primeiro ano, em que consegui já atingir a marca de 6.000 seguidores no Facebook, havia me deixado ainda mais animado...

Com isso, comecei a tirar dinheiro do meu bolso e impulsionar publicações ainda animado com os 6.000 seguidores que tinha alcançado já no primeiro ano. Pessoas apareciam querendo se tornar colaboradoras do projeto e eu pensava que a comunidade colaborativa que eu tanto almejava estava enfim se formando. Contudo, aquele voo do primeiro ano nunca mais seria visto novamente nos anos seguintes. Tampouco aquelas pessoas que se aproximaram de mim querendo ser colaboradores jamais seriam vistas novamente...

Eu recebia e-mails: uns bem produtivos; outros nem tanto. O blogue ia crescendo em conteúdo, e eu em conhecimento. Com isso, nasceram novos conteúdos, como o “Gramática Fácil”, o “Como Aprender?”, o “Dicionário Ganbarou Ze!”, que inclui até mesmo jogos autorais e um injetor de Furigana avançado e interativo, além do livro "Aperte START! - Um Jogo Chamado Vida", cujas vendas serviriam para investir em mais conteúdo para o blogue e parcerias visando aumentar o alcance do projeto e abrir portas para brasileiros no Japão (e por que não para japoneses no Brasil).

12 anos se passaram e penso que fui ambicioso demais para a pouca relevância e pouco comprometimento do nicho em questão. Sim, desde o começo eu tinha consciência de que a língua japonesa tem pouco apelo no Brasil e é só considerar o pequeno e estagnado mercado editorial voltado à língua japonesa no Brasil. Contudo, eu pensava (e isto REALMENTE me decepcionou muito) que apesar de pequeno, o nicho seria capaz de se unir, colaborar e produzir algo realmente grandioso e revolucionário. Eu realmente pensava: “O Brasil tem condições de se tornar REFERÊNCIA NO MUNDO no ensino e didática de língua japonesa”.

Triste engano meu...

Um dos motivos que me levam a dizer que este nicho não é para mim é que eu tive as portas fechadas não somente pelo nicho em si, mas por GRANDES INSTITUIÇÕES e GRANDES INFLUENCIADORES relacionados ao Japão. Ou seja, se grandes instituições e grandes influenciadores fecham as portas e/ou ignoram este conteúdo, resta apenas o próprio nicho que o consome engajar e o divulgar, mas isso NÃO ACONTECE! Em outras palavras, estou praticamente preso a um ciclo, negativamente falando...

Eu gosto do mundo retrogaming e, para fazer uma analogia, gostaria de citar o Tiozão dos Games. Ele é uma figura polêmica, a quem vejo muitas críticas por supostamente se valer da moral que ele conquistou com personalidades populares do nicho para inflacionar o mercado de jogos retrô.

Ou seja: ele supostamente vende algo comum a preços altos apenas pelo prestígio que ele adquiriu de pessoas populares e famosas no nicho de games.

Pergunto: Qual o problema disso?

Eu sempre digo que o motor do ser humano NÃO é o dinheiro; é o PRESTÍGIO SOCIAL e é justamente o medo de perder o PRESTÍGIO SOCIAL que provavelmente faz pessoas consumirem o conteúdo do Ganbarou Ze!, mas não aparecerem na forma de divulgação e engajamento! Entretanto, alguém tem dúvidas de que se o NEYMAR começasse a estudar japonês pelo Ganbarou Ze!, as baratas que estão escondidas no esgoto apareceriam alardeando que conhecem o Projeto Ganbarou Ze! há tempos??

Percebe? Eu não precisaria necessariamente mudar o conteúdo; bastaria eu CONQUISTAR MORAL com alguém de prestígio para poder beber desse mesmo prestígio. E as pessoas brotariam como água para se sentirem igualmente prestigiadas também.

Por isso, aqueles que criticam o Tiozão dos Games por ele supostamente buscar o prestígio apenas de pessoas prestigiadas no nicho para inflacionar o mercado de games, no fundo fazem a mesma coisa: como somos movidos pelo PRESTÍGIO SOCIAL, queremos ser associados ao melhor emprego aos olhos da sociedade, às melhores pessoas aos olhos da sociedade, aos melhores atributos de beleza e de moda aos olhos da sociedade, a uma família unida, estruturada e próspera aos olhos da sociedade, etc.

E para este nicho, eu provavelmente não tenha esses atributos positivos aos olhos da sociedade... por isso, consomem o conteúdo na surdina. Ou seja, reconhecem o valor técnico do conteúdo, mas ao mesmo tempo, enxergam que estar associado à pessoa que o faz é uma possível ameaça ao prestígio social delas. Podem pensar: “Se uma pessoa com deficiência (alguém inferior) consegue aprender japonês, OS OUTROS podem pensar que o japonês não é algo exótico e difícil como quero que pensem para eu ser prestigiado” ou “Se eu demonstrar que estou aprendendo de uma pessoa com deficiência (alguém inferior), OS OUTROS podem pensar que sou burro”. E por aí vai...

Como eu disse, todos nós queremos ser associados ao melhor emprego aos olhos da sociedade, às melhores pessoas aos olhos da sociedade, aos melhores atributos de beleza e de moda aos olhos da sociedade, a uma família unida, estruturada e próspera aos olhos da sociedade, etc. Isso é o instinto de sobrevivência.

E um dos motivos que me leva a dizer que o projeto secou definitivamente é que, sabendo eu que deveria tentar CONQUISTAR MORAL com alguém de prestígio para poder beber desse mesmo prestígio, já entrei em contato com GRANDES INSTITUIÇÕES e GRANDES INFLUENCIADORES relacionados ao Japão sem ter tido sucesso...

Parece que para as grandes instituições, para os grandes influenciadores e para o PRÓPRIO NICHO, tudo está bom do jeito que as coisas estão. O Ganbarou Ze! (ou qualquer outro tipo de inovação) é totalmente desnecessário. Definitivamente, o nicho dos apreciadores do Japão é infelizmente o PIOR grupo social ao qual já tentei me integrar e não o recomendo a ninguém que espera realmente esforço coletivo e comprometimento por aquilo que dizem gostar (da boca para fora). Eu arriscaria até mesmo a dizer que muitos são apenas oportunistas que USAM o Japão para tentar passar uma FACHADA de pessoa supostamente mais virtuosa que os outros, algo muito comum no meio religioso e político, por exemplo. Se é pelos frutos que conhecemos a árvore, então, infelizmente a minha conclusão parece estar certa: muitos autonomeados “especialistas” de Japão que NADA fazem de realmente concreto, inovador e relevante e só repetem como papagaios as mesmas asneiras de sempre para parecerem supostamente mais virtuosos.

Apesar dessas adversidades, faz 12 anos que estou aprendendo e me divertindo com este projeto. E assim continuarei até quando o destino me permitir...

domingo, 3 de maio de 2026

TEMOS “TEXTO PARA FALA” NO FURIGANBAROU!

Continuando a saga de melhorias no FuriGanbarou!, o primeiro e (até agora) único injetor de Furigana brasileiro, adicionei a funcionalidade de “texto para fala”:

Não sou programador, mas pelo que entendi do que foi dito pelos meus “programadores virtuais”, o navegadores similares ao Chrome conseguem lidar melhor com a funcionalidade de texto para fala, ao contrário, por exemplo, do Firefox, que precisa que as vozes estejam instaladas no computador.

Além da nova funcionalidade, o código tem passado por constantes revisões e melhorias, o que tem aumentado a precisão dos furiganas. Um exemplo é a expressão “灰吹きから蛇が出る”, que o MECAB segmenta assim:

灰吹き	ハイフキ	ハイフキ	灰吹き	名詞-普通名詞-一般		

から	カラ	カラ	から	助詞-格助詞		

蛇	ヘビ	ヘビ	蛇	名詞-普通名詞-一般		

が	ガ	ガ	が	助詞-格助詞		

出る	デル	デル	出る	動詞-一般	下一段-ダ行	終止形-一般

Porém, a pronúncia correta desta expressão fixa é: 灰吹[はいふ]きから蛇[じゃ]が出[で]る. Como ela consta no EDICT, o FuriGanbarou! consegue saber qual pronúncia aplicar. Isso, aliás, mostra-nos como nenhum segmentador é infalível, não importa o quão complexa seja sua lógica de probabilidades e/ou a quantidade de entradas em sua base de dados.

Segundo o que entendi dos meus “programadores virtuais”, o MECAB é difícil de ser integrado a navegadores por ter um lógica de probabilidade complexa, o que torna seus arquivos enormes e uma base de dados com cerca de 800.000 itens, sendo palavras e nomes (o que, convenhamos, ultrapassei com a integração do EDICT/ENAMDICT, com mais de 1 milhão de itens e atualizados DIARIAMENTE). Sem contar que a última atualização do dicionário usado comumente com o MECAB data de 2020, o que já o pode tornar impreciso diante de palavras/expressões novas.  Só para ter uma ideia, só na última semana foram acrescentadas 356 novas palavras no EDICT. É muita coisa.

Quando eu digo que foi muito bom que eu não tenha conseguido fazer parcerias com programadores humanos, é  por que eu converso com meus “programadores virtuais” praticamente todos os dias e “cobro” muito deles (além, é claro, desse nicho parasita, que continua a consumir o conteúdo, mas é nulo em engajamento e/ou divulgação, o que obviamente afasta e/ou desmotivaria 99,9% de QUALQUER parceria que eu venha a fazer).

quarta-feira, 22 de abril de 2026

AGORA O FURIGANBAROU TEM VAR!

E aqui estou eu novamente para relatar a implementação de mais uma daquelas minhas ideias malucas no FuriGanbarou! Agora ele tem o VAR!

Como gosto muito de futebol e estamos em ano de Copa do Mundo, tive a ideia de disponibilizar mais uma ferramenta inspirada no futebol. O VAR do FuriGanbarou! está dentro da ferramenta de FUSÃO:

Para entender o funcionamento do nosso VAR, observe a oração abaixo:

Perceba que “君” está com o Furigana errado (fui eu que coloquei!) e é um Kanji isolado (ele está sozinho entre as setas da fusão). Nestes casos, o Kanji pode ser arrastado para a área do VAR para que seja feita uma reanálise de sua pronúncia:

O VAR então analisa e dá o veredito:

Além da disponibilização do VAR, o código do FuriGanbarou! tem passado por revisões e melhorias quase diárias.

Muitos se autonomeiam “especialistas”, pagando de limpinhos na Internet. Contudo, mais uma vez (e sempre!), é o Projeto Ganbarou Ze! que inova entregando frutos neste nicho inundado por mesmice, belas fachadas e um certo conformismo com a situação atual. Enquanto a maioria ficar nessa FRESCURA e INFANTILIDADE como se tudo que é relacionado ao Japão tivesse que ter uma aura exótica, extremamente seletiva e distante desse mundo real, nada vai mudar… estamos falando apenas de um país como qualquer outro e de uma cultura como qualquer outra. Não há nada de especial e messiânico nisso. É só uma questão de gosto pessoal. Não estamos falando de seitas ou religiões…

Mas há loucos para tudo neste mundo…

domingo, 19 de abril de 2026

FURIGANBAROU! E A FUUUUUUUUSÃO!

Há apenas dez dias lancei o FuriGanbarou! e hoje posso dizer que terminei de implementar a funcionalidade mais audaciosa da ferramenta. Contudo, primeiro gostaria de destacar que adicionei a possibilidade de aplicar as entradas do ENAMDICT (nomes) à correção automática. Peguemos como exemplo a seguinte oração:

京都の三室戸寺しだれ梅がきれいに咲いている。

O FuriGanbarou! vai aplicar os furiganas assim:

京都[きょうと]の三室戸[みむろと]寺[てら]しだれ梅[うめ]がきれいに咲[]いている。

Ele quase acertou tudo se não fosse pelo “寺[てら]”. Aplicando a correção automática, agora aparecerá a opção de selecionar NOMES para qualquer parte do texto que seja selecionada. Assim:

E a oração ficará:

京都[きょうと]の三室戸[みむろど]寺[]しだれ梅[うめ]がきれいに咲[]いている。

Agora está certo, mas veja que “寺[]” continua “solto”. E é por causa disso que criei a funcionalidade da FUSÃO. Ativando-a no botão dourado, você perceberá que aparecerão setas (↔) vermelhas ao final de cada palavra:

Essas setas vermelhas permitem que cada segmento seja arrastado para o elemento ao lado. Por exemplo, vamos arrastar “寺[]”  para dentro de “三室戸[みむろど]”. Assim:

Veja que agora temos:

京都[きょうと]の三室戸寺[みむろどじ]しだれ梅[うめ]がきれいに咲[]いている。

Neste exemplo, houve apenas a fusão de pronúncias propriamente dita, contudo, podem haver casos em que a pronúncia mudará. É o caso de “世界中” que o FuriGanbarou! deixa “世界[せかい]中[なか]”, mas se fizermos a FUSÃO fica “世界中[せかいじゅう]”.

Além da nova funcionalidade da FUSÃO, melhorei bastante o código da segmentação, então, sendo um pouco presunçoso, posso dizer que o FuriGanbarou! é o injetor de Furiganas mais avançado que existe!

E o FuriGanbarou! está em constante atualização!

quarta-feira, 15 de abril de 2026

NOVA FUNCIONALIDADE NO FURIGANBAROU!: REMODELAÇÃO

E mais uma vez levanto da cama com ideias na cabeça e corro para a “reunião” com meus “programadores virtuais” a fim de colocar minha ideia em prática.

As melhorias foram todas no FuriGanbarou!. Primeiro, melhorei a maneira como os dicionários são baixados e agora tudo é feito com maior rapidez e com menos chances (espero!) de erros.

A segunda mudança é que adicionei aos dicionários do FuriGanbarou! o KANJIDIC, talvez a base de dados de Kanjis mais usada da internet.

Tudo isso pensando na nova funcionalidade do FuriGanbarou!: a REMODELAÇÃO.

Basicamente eu poderia explicar o que a remodelação faz assim: a correção automática corrige os Furiganas mantendo o posicionamento dentro de uma palavra. Já a REMODELAÇÃO pode alterar o posicionamento dos Furiganas dentro de uma palavra. Peguemos, por exemplo, a palavra “側面攻撃”, adicionada esta semana à base do projeto EDICT. No FuriGanbarou! teremos:

Note que, por padrão, o FuriGanbarou! considera a palavra inteira para aplicar o Furigana. Contudo, sempre haverá aqueles (EU, por exemplo) que preferem que o Furigana seja inserido considerando partes menores da palavra. Eu particularmente acho que isso ajuda a criar uma memória visual com relação à formação de palavras. Dito isso, podemos fazer isto:

Ao selecionar uma parte da palavra, o FuriGanbarou! verifica se ela é uma palavra que consta no EDICT e, então, mostra um tique verde. Clicando no botão de remodelação, teremos:

O FuriGanbarou! reposiciona o Furigana considerando o todo. É importante lembrar que para que a REMODELAÇÃO seja ativada, a seleção da parte da palavra deve ser feita com o bloco pontilhado azul ativo, sendo que ele aparece ao se aproximar o ponteiro do mouse da palavra.

Mais uma vez o Projeto Ganbarou Ze! inova, disponibilizando uma ferramenta pioneira BRASILEIRA GRATUITAMENTE!