comparatilhe

Inteligência artificial, é assim que a Índia tenta preencher a lacuna: aí vem Hanooman, seu ChatGPT

AI, Hanooman é capaz de operar em 11 idiomas locais. O objetivo é disponibilizar a nova tecnologia para toda a população. Mas não faltam polêmicas e problemas em relação à inclusão do projeto: veja por que

Inteligência artificial, é assim que a Índia tenta preencher a lacuna: aí vem Hanooman, seu ChatGPT

Também 'Índia entra no campo da inteligência artificial. A República Indiana (Bhārat em Hindi) está se preparando para lançar seu modelo de linguagem Hanooman, um grande modelo de linguagem (Llm) semelhante ao ChatGPT, capaz de operam em 11 das 22 línguas oficiais do país. O lançamento oficial do Hanooman está previsto para o próximo mês.

Apresentado por Seetha Mahalaxmi Saúde (Sml) em colaboração com oEcossistema BharatGPT, liderado pelo IIT Bombay, liderado pelo IIT, Hanooman pretende revolucionar setores-chave como governança, saúde, educação e serviços financeiros. O ecossistema BharatGPT é um consórcio de pesquisa liderado pelo Instituto Indiano de Tecnologia (IIT) Bombay, apoiado por outros sete IITs, além do Departamento de Ciência e Tecnologia, SML. Além do apoio do governo e das universidades indianas, o projeto também conta com o envolvimento de uma filial da Indústrias Reliance, Reliance Jio, uma das principais operadoras móveis da Índia, liderada por Akash Ambani, de trinta anos, filho de Mukesh Ambani, o homem mais rico da Ásia.

Índia: o que é Hanooman e como funciona

Hanooman foi nomeado em homenagem à divindade hindu Hanuman, conhecida por sua força e inteligência. O objetivo é tornar as tecnologias avançadas de IA acessíveis em até 11 idiomas locais, atendendo a um diversificado grupo demográfico indiano. É um conjunto de grandes modelos de linguagem indexados treinados em 22 idiomas indianos, com variantes de até 40 bilhões de parâmetros.

Hanooman possui recursos de IA multimodal para gerar conteúdo em diferentes formatos, como texto, voz e vídeo. Ganesh Ramakrishnan, um dos iniciadores do projeto e chefe do Departamento de Engenharia e Ciência da Computação do IIT Bombay, disse que Hanooman permitirá a conversão de voz em texto, facilitando assim o acesso à informação para milhões de indianos que não sabem ler ou escrever . Futuramente, o modelo também será estendido para idiomas não considerados na versão inicial.

Um dos principais desafios na construção de grandes modelos linguísticos na Índia é a obtenção de conjuntos de dados de alta qualidade nos idiomas locais. Melhorar a qualidade destes conjuntos de dados, que incluem texto, áudio e vídeo em línguas indianas, é um primeiro passo crítico. Hanooman se junta a outros modelos de linguagem na corrida da IA, como Krutrim de Ola, OpenHathi de SaravamAI e modelo Airavata de IIT-Madras.

No que se refere a regulamentação da IA, espera-se que o governo indiano apresente um projeto de estrutura regulatória para IA até julho de 2024.

Inteligência artificial: os desafios da Índia no setor

A Índia, apesar de ser conhecida pela sua inclinação para a tecnologia, tinha até agora permanecido um pouco atrás no campo da Inteligência Artificial. Com o advento do Hanooman, isso é esperado lacuna é preenchida, marcando um importante passo em frente no objectivo do país asiático de emergir como um líder global em IA.

Além disso, o projeto representa um grande desafio também no campo linguístico. A diversificação geográfica do consórcio de investigação foi deliberada para tornar a Inteligência Artificial acessível a uma grande parte da população indiana que não fala inglês. Depois, há também o problema linguístico nativo. A Índia tem cerca de 22 idiomas. Atualmente, os modelos podem operam em 11 idiomas indianos que incluem algumas das línguas indo-arianas, como o hindi, o bengali e o marathi, faladas em Delhi, Calcutá e Mumbai, respectivamente, e também as línguas dravidianas do sul, como o tâmil, o telugu e o malaiala. O objetivo futuro será ampliar as capacidades do modelo para cobrir todas as 22 línguas indianas.

Não faltam alguns dúvidas nas boas intenções do projeto. Estranhamente, entre os primeiros onze idiomas inseridos, oausência de Urdu, a sétima língua mais falada na Índia e predominante entre a população muçulmana. Um sinal, juntamente com a escolha do nome do modelo e do consórcio, que levantou questões sobre as intenções de inclusão do projeto. Esta falta é, de facto, particularmente significativa dado que a comunidade muçulmana tem indicadores sociais e de rendimento mais baixos e poderia beneficiar mais do acesso directo à informação educacional e de saúde, especialmente para as mulheres.

Um dos promotores do projeto, Ganesh Ramakrishnan, chefe do Departamento de Ciência da Computação e Engenharia do IIT Bombay, explicou que Hanooman oferecerá a possibilidade de converter voz em texto, para ajudar os milhões de indianos que não sabem ler nem escrever, e no futuramente será estendido a idiomas não cobertos na versão inicial.

Comente