[gem_fullwidth background_style=”cover” background_position_vertical=”center” background_parallax=”1″ background_parallax_mobile=”1″ fullheight=”1″ padding_top=”150″ padding_bottom=”120″ background_color=”#000c55″ background_image=”78559″]
[gem_divider margin_top=”28″]

[gem_divider margin_top=”24″]

18  e 19/11 – ESPM SÃO PAULO (CAMPUS ÁLVARO ALVIM)
R. DR. ÁLVARO ALVIM, 123 – VILA MARIANA
[gem_divider margin_top=”50″][gem_button position=”center” size=”large” corner=”50″ icon_pack=”elegant” icon_position=”right” text=”CONFIRA O SITE DO EVENTO” hover_background_color=”#4719ff” link=”url:https%3A%2F%2Fcoda.escoladedados.org|target:_blank” text_color=”#ffffff” hover_text_color=”#ffffff” background_color=”#a38dff”][gem_divider margin_top=”50″][gem_divider margin_top=”50″][/gem_fullwidth]

IA É ESTATÍSTICA, MAS NINGUÉM TE CONTOU ISSO

[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f133″ icon_color=”#a38dff”]

DIA:
19/11

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f017″ icon_color=”#a38dff”]

HORÁRIO:
11:15h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f252″ icon_color=”#a38dff”]

DURAÇÃO:
1:30h

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” centered=”1″ icon_fontawesome=”f0ae” icon_color=”#a38dff”]

Nível:
Básico

[/gem_icon_with_text]
[gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f085″ icon_color=”#a38dff” icon_top_margin=”10″ icon_left_side_padding=”10″]

Sobre o workshop

[/gem_icon_with_text]

Texto por Renan Cavalcante

 

Desde o lançamento do ChatGPT, em novembro de 2022, a discussão sobre Inteligência Artificial (IA) estourou a bolha de profissionais e pesquisadores da área. Mas, entre tantas análises e opiniões, algo pouco lembrado é a centralidade da estatística para o funcionamento de ferramentas de IA.

Para a instrutora Júlia Tessler, se inteligência artificial é estatística, o primeiro passo é entender que a IA utiliza conceitos básicos deste campo da matemática. Recursos como média, mediana, quartis e percentis se unem à probabilidade para formar algoritmos que fazem o processamento de linguagem natural (NLP, na sigla em inglês) para fabricar textos em tempo real.

O processamento de linguagem natural nas inteligências artificiais é feito por meio de deep learning com base em vetores. Por isso, é possível dizer que as IAs são uma manipulação da álgebra linear. 

Os corpus de textos, ou bases, são treinados para agrupar palavras parecidas e fazer correlações, positivas e negativas, que resultam em vetores de comprimentos diferentes. E, assim como na probabilidade, quanto maior a amostra menor a chance de erro. Então, quanto mais texto, mais vetores são gerados e mais precisas são as relações criadas entre as palavras.

Para demonstrar o funcionamento dos vetores, a palestrante utilizou a palavra Japão como exemplo. Ao rodar uma base com muitas palavras, em algum momento acontecerá a correlação com a palavra japonês. A partir dessa relação, a IA consegue relacionar outras palavras que surjam no mesmo contexto, como França e francês. Dessa forma, as relações podem extrapolar para analogias e vínculos semânticos.

Por fim, Júlia concluiu indicando um curso sobre NLP com Deep Learning que utiliza o algoritmo GloVe para a vetorização de palavras, a partir de trabalho com aprendizado não-supervisionado. A formação é oferecida pela Universidade de Stanford e é ministrada por Christopher Manning, professor de Machine Learning, Linguística e Ciências da Computação em Stanford e criador do GloVe.

 

Referências

Notebook da atividade

Curso de Processamento de Linguagem Natural de Stanford

GloVe

[gem_divider margin_top=”50px”][gem_icon_with_text icon_pack=”fontawesome” flow=”1″ icon_fontawesome=”f133″ icon_color=”#a38dff” icon_top_margin=”10″ icon_left_side_padding=”10″]

Pré-requisitos da atividade

[/gem_icon_with_text]

Sem pré-requisitos.

julia-tessler

Júlia Tessler

Cientista de dados na Jusbrasil.

Visite os sites das edições anteriores: 20162017201820192020, 2021 e 2022.

[gem_socials colored=”custom” alignment=”right” icons_size=”16″ socials=”%5B%7B%22social%22%3A%22facebook%22%2C%22url%22%3A%22https%3A%2F%2Ffacebook.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22twitter%22%2C%22url%22%3A%22https%3A%2F%2Ftwitter.com%2Fescoladedados%22%7D%2C%7B%22social%22%3A%22instagram%22%2C%22url%22%3A%22https%3A%2F%2Finstagram.com%2FOpenKnowledgeBrasil%22%7D%2C%7B%22social%22%3A%22youtube%22%2C%22url%22%3A%22https%3A%2F%2Fwww.youtube.com%2FEscoladeDados%22%7D%5D” color=”#ffffff”]

Nosso conteúdo está disponível sob a licença Creative Commons Atribuição 4.0 Internacional, e pode ser compartilhado e reutilizado para trabalhos derivados, desde que citada a fonte.