Pesquisadores das universidades de Washington, Copenhague e Stanford publicaram um estudo alarmante que sugere que modelos de inteligência artificial da OpenAI, como o GPT-4, podem ter memorizado conteúdo protegido por direitos autorais, levantando questões cruciais sobre a ética e legalidade do seu uso.
O estudo, divulgado recentemente, revela que a metodologia da OpenAI em treinar seus modelos pode envolver a utilização de material com copyright sem a devida autorização. Essa descoberta ganha destaque em meio a um crescente debate sobre a propriedade intelectual na era digital, onde autores e detentores de direitos têm questionado as práticas da empresa.
Os acadêmicos desenvolveram uma abordagem inovadora para investigar a capacidade de memorização dos modelos de IA. Utilizando o que chamam de "palavras de alta surpresa", que são termos estatisticamente raros em determinados contextos, os pesquisadores testaram a habilidade dos modelos em completar textos. O êxito em preencher essas lacunas sugere que o modelo pode ter incorporado partes do material original durante seu treinamento, levantando dúvidas sobre a originalidade e a ética do conteúdo gerado.
As implicações desse estudo não se restringem à teoria, mas se estendem ao campo jurídico. A OpenAI argumenta que seu uso de material protegido poderia ser considerado dentro da doutrina de "uso justo" estabelecida nos Estados Unidos. Contudo, a empresa precisa se preparar para enfrentar uma série de desafios legais, incluindo uma demanda judicial do *The New York Times*, que afirma que os modelos da OpenAI utilizaram palavras e frases de seus artigos sem permissão.
Os achados deste estudo também evidenciam a urgência por uma maior transparência em relação aos dados usados pelo treinamento dos modelos de IA. Abhilasha Ravichander, uma das coautoras da pesquisa, ressalta que a confiança nos grandes modelos de linguagem depende da possibilidade de que esses algoritmos sejam auditáveis e verificáveis. A obscuridade sobre os conjuntos de dados de treinamento não só pode resultar em disputas legais futuras, mas também levanta sérias questões éticas que precisam ser abordadas.
O cenário atual da inteligência artificial nos força a reavaliar a forma como desenvolvemos e implementamos essas tecnologias em nossa sociedade, especialmente quando se trata de respeitar e proteger os direitos autorais e a propriedade intelectual.