Capítulo 91 – Machine Learning – Guia Definitivo – Parte 1
Nos 10 capítulos finais deste livro online vamos trazer um grande resumo sobre Machine Learning. O objetivo é fornecer uma visão clara do que é e como Machine Learning está sendo usado no dia a dia, um pouco de matemática, as principais regras e princípios. Queremos ainda que esses capítulos finais possam servir de material de referência para os alunos que estão buscando as certificações oferecidas pela DSA no Bootcamp de Certificação.
Serão 10 partes no total com um guia completo sobre Machine Learning. Aproveite a leitura para compreender de forma definitiva o que é uma das tecnologias mais incríveis do nosso tempo.
Começaremos com uma visão geral! Boa leitura.
Visão Geral
O Aprendizado de Máquina (Machine Learning) está por trás de chatbots, aplicativos de tradução de idiomas, os programas que a Netflix sugere para você e como seus feeds de mídia social são apresentados. Machine Learning alimenta veículos e máquinas autônomos que podem diagnosticar condições médicas com base em imagens. Deep Learning, que estudamos ao longo de todo este livro até aqui, é um subcampo de Machine Learning.
Quando as empresas hoje implantam programas de Inteligência Artificial, provavelmente estão usando Machine Learning – tanto que os termos são frequentemente usados de forma intercambiável e às vezes ambígua. O Aprendizado de Máquina é um subcampo da Inteligência Artificial (IA) que dá aos computadores a capacidade de aprender sem serem explicitamente programados.
Nos últimos 10 anos, o Aprendizado de Máquina se tornou a principal técnica por trás de aplicações de IA. É por isso que algumas pessoas usam os termos IA e Aprendizado de Máquina quase como sinônimos, pois a maioria dos avanços atuais em IA envolvem Aprendizado de Máquina.
Com a crescente onipresença de aplicações de Machine Learning, todos os negócios provavelmente o encontrarão e precisarão de algum conhecimento prático sobre esse campo. Uma pesquisa da Deloitte descobriu que 67% das empresas estão usando Aprendizado de Máquina e 97% estão usando ou planejando usá-lo no futuro próximo.
Da manufatura ao varejo e do setor bancário à agricultura, há muitas empresas usando Machine Learning para aumentar a eficiência. “O Aprendizado de Máquina está mudando, ou mudará, todos os setores e os líderes precisam entender os princípios básicos, o potencial e as limitações”, disse o professor de ciência da computação do MIT, Aleksander Madry, diretor do MIT Center for Deployable Machine Learning.
Embora nem todos precisem conhecer os detalhes técnicos, eles devem entender o que a tecnologia faz e o que ela pode e não pode fazer (ainda). Ninguém pode se dar ao luxo de não estar ciente do que está acontecendo.
Isso inclui estar ciente das implicações sociais e éticas do Aprendizado de Máquina. “É importante se engajar e começar a entender essas ferramentas e depois pensar em como você vai usá-las para o bem. Temos que usar essas ferramentas para o bem de todos”, disse o Dr. Joan LaRovere, médico pediátrico de terapia intensiva cardíaca e cofundador da The Virtue Foundation, organização sem fins lucrativos. “A IA tem muito potencial para fazer o bem e precisamos realmente manter isso em nossas lentes enquanto pensamos nisso. Como usamos a tecnologia para fazer o bem e melhorar o mundo?”
Mas Afinal, o Que é Machine Learning?
O Aprendizado de Máquina é um subcampo da Inteligência Artificial (e Deep Learning é um subcampo de Machine Learning), que é amplamente definido como a capacidade de uma máquina de imitar o comportamento humano inteligente. Os sistemas de Inteligência Artificial são usados para realizar tarefas complexas de maneira semelhante à forma como os humanos resolvem problemas.
O objetivo da IA é criar modelos de computador que exibam “comportamentos inteligentes” como os humanos, de acordo com Boris Katz, principal cientista de pesquisa e chefe do Grupo InfoLab no CSAIL. Isso significa máquinas que podem reconhecer uma cena visual, entender um texto escrito em linguagem natural ou realizar uma ação no mundo físico.
O Aprendizado de Máquina é uma maneira de usar a IA. Foi definido na década de 1950 pelo pioneiro da IA Arthur Samuel como “o campo de estudo que dá aos computadores a capacidade de aprender sem serem explicitamente programados”.
A definição é verdadeira, de acordo com Mikey Shulman, professor do MIT Sloan e chefe de Aprendizado de Máquina da Kensho, especializada em Inteligência Artificial para as comunidades de finanças e inteligência dos EUA. Ele comparou a maneira tradicional de programar computadores, ou “software 1.0”, à panificação, onde uma receita pede quantidades precisas de ingredientes e diz ao padeiro para misturar por um período exato de tempo. A programação tradicional também requer a criação de instruções detalhadas para o computador seguir.
Mas, em alguns casos, escrever um programa para a máquina seguir é demorado ou impossível, como treinar um computador para reconhecer fotos de pessoas diferentes. Embora os humanos possam fazer essa tarefa facilmente, é difícil dizer a um computador como fazê-lo. O Aprendizado de Máquina adota a abordagem de permitir que os computadores aprendam a se programar por meio da experiência.
O Aprendizado de Máquina começa com dados – números, textos, transações bancárias, fotos de pessoas, registros de acesso a servidores web, dados de séries temporais de sensores ou relatórios de vendas. Os dados são coletados e preparados para serem usados como dados de treinamento ou as informações nas quais o modelo de Aprendizado de Máquina será treinado. Quanto mais dados, melhor o programa.
A partir daí, os Cientistas de Dados escolhem um modelo de Aprendizado de Máquina para usar, fornecem os dados e permitem que o modelo seja treinado para encontrar padrões e fazer previsões. Com o tempo, o programador humano também pode ajustar o modelo, incluindo alterar seus parâmetros, para ajudá-lo a obter resultados mais precisos. O site AI Weirdness, da cientista de pesquisa Janelle Shane, é uma visão divertida de como os algoritmos de Aprendizado de Máquina aprendem e como eles podem errar.
Alguns dados são extraídos a partir dos dados de treinamento para serem usados como dados de avaliação, que testam a precisão do modelo de Aprendizado de Máquina quando são mostrados novos dados. O resultado é um modelo que pode ser usado no futuro com diferentes conjuntos de dados.
Algoritmos de Aprendizado de Máquina bem-sucedidos podem fazer coisas diferentes, escreveu Malone em uma pesquisa recente sobre IA e o futuro do trabalho, em coautoria da professora do MIT e diretora do CSAIL, Daniela Rus, e Robert Laubacher, diretor associado do MIT Center for Collective Intelligence.
“A função de um sistema de Aprendizado de Máquina pode ser descritiva, o que significa que o sistema usa os dados para explicar o que aconteceu; preditiva, significando que o sistema usa os dados para prever o que acontecerá; ou prescritiva, o que significa que o sistema usará os dados para fazer sugestões sobre quais ações tomar”, escreveram os pesquisadores.
Tipos de Aprendizado de Máquina
Os modelos de Aprendizado de Máquina supervisionados são treinados com conjuntos de dados rotulados, que permitem que os modelos aprendam e se tornem mais precisos ao longo do tempo. Por exemplo, um algoritmo seria treinado com fotos de cães e outras coisas, todas rotuladas por humanos, e a máquina aprenderia maneiras de identificar fotos de cães por conta própria. O Aprendizado de Máquina supervisionado é o tipo mais comum usado hoje.
No Aprendizado de Máquina não supervisionado, um programa procura padrões em dados não rotulados. O Aprendizado de Máquina não supervisionado pode encontrar padrões ou tendências que as pessoas não estão procurando explicitamente. Por exemplo, um modelo de Aprendizado de Máquina não supervisionado pode analisar dados de vendas on-line e identificar diferentes tipos de clientes que fazem compras.
O Aprendizado de Máquina de reforço treina as máquinas por meio de tentativa e erro para tomar a melhor ação, estabelecendo um sistema de recompensa. O aprendizado por reforço pode treinar modelos para jogar ou treinar veículos autônomos para dirigir, informando à máquina quando ela tomou as decisões corretas, o que a ajuda a aprender ao longo do tempo quais ações devem ser tomadas.
O Aprendizado de Máquina é mais adequado para situações com muitos dados – milhares ou milhões de exemplos, como gravações de conversas anteriores com clientes, logs de sensores de máquinas ou transações comerciais. Por exemplo, o Google Tradutor foi possível porque “treinou” na grande quantidade de informações na web, em diferentes idiomas.
Em alguns casos, o Aprendizado de Máquina pode obter insights ou automatizar a tomada de decisões em casos em que os humanos não conseguiriam. Pode não apenas ser mais eficiente e menos dispendioso ter um algoritmo para fazer isso, mas às vezes os humanos literalmente não são capazes de fazê-lo.
Com o conceito de Machine Learning claramente definido, vejamos como Machine Learning está sendo usado pelas empresas. Acompanhe o próximo capítulo.
Referências:
Machine Learning com R e Python