A Microsoft liberou ontem o Computational Network Toolkit (CNTK) no GitHub, com o objetivo de fazer seus pesquisadores aumentarem os avanços em inteligência artificial com suas próprias ferramentas.

Os pesquisadores desenvolveram o kit de ferramentas open source por necessidade. Xuedong Huang, cientista da Microsoft, disse que ele e sua equipe estavam ansiosos para fazer melhorias mais rápidas na forma como os computadores podem compreender a fala, e as ferramentas que eles tinham para fazer isso acabaram atrasando-os em seu progresso. Então, um grupo de voluntários decidiu resolver esse problema por conta própria, usando uma solução que alavancou seu desempenho.

Em testes internos, Huang disse que o CNTK mostrou-se mais eficiente do que outros quatro conjuntos de ferramentas computacionais populares que os desenvolvedores usam para criar modelos de deep learning para coisas como fala e reconhecimento de imagem.

Esses tipos de ganhos de desempenho são extremamente importantes na área de deep learning, porque algumas das maiores tarefas do setor podem levar semanas para serem concluídas.

Ao longo dos últimos anos, o campo do deep learning explodiu, à medida que mais pesquisadores começaram a executar algoritmos de aprendizado de máquina utilizando redes neurais profundas, que são sistemas inspirados nos processos biológicos do cérebro humano. Muitos pesquisadores veem deep learning como uma abordagem muito promissora para tornar a inteligência artificial melhor.

Além disso, esses ganhos têm permitido aos pesquisadores criarem sistemas que podem reconhecer com precisão e até mesmo traduzir conversas, bem como reconhecer imagens e responder a perguntas sobre eles.

Internamente, a Microsoft está usando o CNTK em um conjunto de computadores poderosos que utilizam unidades de processamento gráfico, ou GPUs.

Embora GPUs sejam projetados para gráficos de computador, os pesquisadores descobriram que eles também são ideais para o processamento de algoritmos que estão levando a esses grandes avanços na tecnologia, como ouvir e entender a fala, e reconhecer imagens e movimentos.

Huang disse que era importante para sua equipe ser capaz de atender às necessidades internas da Microsoft com uma ferramenta como o CNTK, mas eles também queriam fornecer os mesmos recursos para outros pesquisadores que estão fazendo avanços similares em deep learning. Por isso eles decidiram tornar as ferramentas disponíveis em código aberto para outros pesquisadores e desenvolvedores.

Em abril, o kit de ferramentas foi disponibilizado para pesquisadores acadêmicos. Agora, ele está disponível para qualquer pessoa que queira usá-lo.

 

Fonte: Imasters