{"id":9869,"date":"2026-06-14T18:00:30","date_gmt":"2026-06-14T21:00:30","guid":{"rendered":"https:\/\/ilheusnews.com.br\/?p=9869"},"modified":"2026-06-14T18:00:30","modified_gmt":"2026-06-14T21:00:30","slug":"matematicos-testam-ias-em-harvard-e-modelos-sao-aprovados-em-7-dos-10-problemas","status":"publish","type":"post","link":"https:\/\/ilheusnews.com.br\/?p=9869","title":{"rendered":"Matem\u00e1ticos testam IAs em Harvard e modelos s\u00e3o aprovados em 7 dos 10 problemas"},"content":{"rendered":"<div>\n<p>Trinta matem\u00e1ticos se reuniram em<strong> Harvard<\/strong> esta semana para fazer algo incomum: <strong>corrigir provas feitas por intelig\u00eancia artificial<\/strong>. O projeto <strong><a href=\"https:\/\/1stproof.org\/second-batch.html\" target=\"_blank\" rel=\"noreferrer noopener\">First Proof<\/a><\/strong> testou quatro sistemas de IA em dez problemas que haviam sido resolvidos por humanos, mas nunca publicados.<\/p>\n<p>O resultado, anunciado na semana passada, surpreendeu: sete dos dez problemas receberam ao menos uma solu\u00e7\u00e3o correta. Os quatro sistemas usaram principalmente o GPT-5.5 Pro, da OpenAI \u2013 presente em tr\u00eas das quatro configura\u00e7\u00f5es \u2013 e o Gemini 3.1 Pro Preview, do Google. O Claude Opus 4.7, da Anthropic, apareceu como modelo secund\u00e1rio em um dos sistemas.<\/p>\n<p>Algumas foram classificadas como \u201cimpec\u00e1veis.\u201d Em um caso, o modelo usou uma estrat\u00e9gia diferente da humana e impressionou os avaliadores.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-por-que-matematicos-criaram-seu-proprio-teste\">Por que matem\u00e1ticos criaram seu pr\u00f3prio teste<\/h2>\n<p>A iniciativa surgiu da insatisfa\u00e7\u00e3o com a narrativa das empresas de tecnologia. As companhias anunciam conquistas, mas verificar as solu\u00e7\u00f5es \u00e9 dif\u00edcil e os modelos s\u00e3o inconsistentes.<\/p>\n<p>\u201cN\u00e3o escreve da forma como n\u00f3s escrevemos \u2013 de certa forma, n\u00e3o escreve de maneira honesta\u201d, disse Martin Hairer, matem\u00e1tico do Imperial College London e vencedor da Medalha Fields, ao <em><a href=\"https:\/\/www.washingtonpost.com\/science\/2026\/06\/14\/math-has-helped-define-what-it-means-be-human-centuries-cue-robots\/\" target=\"_blank\" rel=\"noreferrer noopener\">Washington Post<\/a><\/em>.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-humanos-como-alpinistas-ia-como-saltadores\">Humanos como alpinistas, IA como saltadores<\/h2>\n<p>Terry Tao, outro medalhista Fields e professor da Universidade da Calif\u00f3rnia em Los Angeles, encontrou uma analogia precisa para a diferen\u00e7a.<\/p>\n<p>Especialistas humanos s\u00e3o como alpinistas: exploram o terreno com paci\u00eancia, identificam submetas e se ajudam mutuamente. Os sistemas de IA seriam \u201csaltadores\u201d \u2013 capazes de atingir alturas que humanos n\u00e3o atingiriam de uma vez, mas que n\u00e3o falham com eleg\u00e2ncia. Uma tentativa fracassada da IA raramente oferece algo aproveit\u00e1vel para o pr\u00f3ximo passo.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-o-que-a-ia-ainda-nao-sabe-fazer\">O que a IA ainda n\u00e3o sabe fazer<\/h2>\n<p>O ponto cr\u00edtico, segundo matem\u00e1ticos, n\u00e3o \u00e9 resolver problemas, \u00e9 escolh\u00ea-los. Definir o que vale a pena investigar exige julgamento, intui\u00e7\u00e3o e percep\u00e7\u00e3o do contexto maior da disciplina.<\/p>\n<p>Lauren Williams, professora em Harvard e uma das l\u00edderes do First Proof, usou um exemplo simples ao <em>Washington Post<\/em>: um ge\u00f3logo poderia perguntar qual \u00e9 a cor m\u00e9dia de uma pedra na Terra. \u00c9 uma pergunta v\u00e1lida \u2013 mas provavelmente n\u00e3o \u00e9 uma pergunta interessante. A IA n\u00e3o distingue as duas.<\/p>\n<p>S\u00e9bastien Bubeck, matem\u00e1tico da OpenAI, concorda: os modelos resolvem, mas n\u00e3o entendem por que est\u00e3o resolvendo \u2013 nem qual o papel daquele problema no programa maior da matem\u00e1tica.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-2-300-matematicos-assinam-manifesto\">2.300 matem\u00e1ticos assinam manifesto<\/h2>\n<p>Em paralelo aos testes, matem\u00e1ticos lan\u00e7aram a <strong>Declara\u00e7\u00e3o de Leiden<\/strong> \u2013 manifesto internacional com mais de 2.300 signat\u00e1rios que estabelece diretrizes para o uso \u00e9tico e transparente da IA na \u00e1rea.<\/p>\n<p>A declara\u00e7\u00e3o reconhece o potencial da tecnologia, mas aponta riscos: os modelos n\u00e3o creditam as ideias que utilizam, e as empresas promovem sucessos sem transpar\u00eancia sobre os casos de falha.<\/p>\n<h2 class=\"wp-block-heading\" id=\"h-o-contexto-o-problema-de-80-anos\">O contexto: o problema de 80 anos<\/h2>\n<p>Em maio, a OpenAI anunciou que um modelo havia <a href=\"https:\/\/olhardigital.com.br\/2026\/05\/29\/inteligencia-artificial\/openai-diz-que-ia-resolveu-problema-matematico-de-80-anos\/\" target=\"_blank\" rel=\"noreferrer noopener\">refutado uma conjectura de Paul Erd\u0151s sem solu\u00e7\u00e3o h\u00e1 80 anos<\/a>. O resultado foi chamado de \u201csolu\u00e7\u00e3o espetacular\u201d pelo matem\u00e1tico de Princeton Noga Alon.<\/p>\n<p>O First Proof surge como resposta organizada da comunidade cient\u00edfica: em vez de reagir aos an\u00fancios das empresas, os matem\u00e1ticos passaram a definir seus pr\u00f3prios crit\u00e9rios de avalia\u00e7\u00e3o.<\/p>\n<p>O post <a href=\"https:\/\/olhardigital.com.br\/2026\/06\/14\/inteligencia-artificial\/matematicos-testam-ias-em-harvard-e-modelos-sao-aprovados-em-7-dos-10-problemas\/\">Matem\u00e1ticos testam IAs em Harvard e modelos s\u00e3o aprovados em 7 dos 10 problemas<\/a> apareceu primeiro em <a href=\"https:\/\/olhardigital.com.br\/\">Olhar Digital<\/a>.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Trinta matem\u00e1ticos se reuniram em Harvard esta semana para fazer algo incomum: corrigir provas feitas por intelig\u00eancia artificial. O projeto First Proof testou quatro sistemas de IA em dez problemas que haviam sido resolvidos por humanos, mas nunca publicados. O resultado, anunciado na semana passada, surpreendeu: sete dos dez problemas receberam ao menos uma solu\u00e7\u00e3o<\/p>\n","protected":false},"author":6,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"fifu_image_url":"","fifu_image_alt":"","footnotes":""},"categories":[33],"tags":[],"class_list":["post-9869","post","type-post","status-publish","format-standard","hentry","category-noticias"],"_links":{"self":[{"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=\/wp\/v2\/posts\/9869","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=9869"}],"version-history":[{"count":0,"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=\/wp\/v2\/posts\/9869\/revisions"}],"wp:attachment":[{"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=9869"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=9869"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ilheusnews.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=9869"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}