Generative Artificial Intelligence in law

from evaluation methodology to the legal correctness of LLMS and AI agents

Authors

DOI:

https://doi.org/10.18256/g4jnx825

Keywords:

Generative Artificial Intelligence, Large Language Models (LLMs), Legal Interpretation, Double Correction Channel, Evaluation Methodology

Abstract

This work analyzes the use of Generative Artificial Intelligence, specifically Large Language Models (LLMs), to support legal activities by systematically testing fifteen of the main AI models available on the market (ChatGPT o1, ChatGPT 4o, ChatGPT 4.5, ChatGPT o3-mini, ChatGPT o3-mini-high, Claude Sonnet 3.5, Claude Sonnet 3.7, Grok 3, Gemini Pro 2.0 Experimental, Gemini Pro 2.5 Experimental, DeepSeek R1, Qwen 2.5 Max, Perplexity, Sabiá-3 e Copilot). Grounded in the double correction channel theory, the research adopted a multidisciplinary approach for the LLM analyses, six typically legal tests were developed to evaluate the AIs’ performance in: (a) knowledge of Brazilian legislation; (b) legal application; (c) application of legal principles; (d) solving hard cases; (e) identification of the ratio decidendi in the judicial precedents; and (f) organization of case data/information. This study follows a qualitative-quantitative research design with a descriptive-exploratory method, by analyzing results from intersection between Law and Artificial Intelligence. The outcomes are: (a) the establishment of a basic framework for legally testing LLMs; (b) which generative AI models currently best fit each of the tested tasks; (c) the legal tasks for which LLM use is not recommended (or for which greater caution is advised); and (d) the tasks in which LLMs perform best in the legal field. The conclusions are: (a) it is not advisable to use generative AI (LLMs) to access systematized legal knowledge (such as normative texts); (b) it is not a good practice to use generative AI to interpret legal norms freely, without additional controls; (c) most LLMs struggle to infer all correct normative propositions from statutory texts; (d) the use of Retrieval-Augmented Generation (RAG) techniques or auxiliary AIs based on knowledge representation is necessary; (e) the best LLMs showed creativity and a claim to legal correctness when applying legal principles; (f) the best LLMs can be used to assist in generating legally correct argumentation; (g) generative AI models are not reliable repositories of pre-existing knowledge but are capable of creating new knowledge (AI’s knowledge/creation paradox); (h) the top generative AI models can be used in the argumentative exploration of judicial precedents (identifying the ratio decidendi); (i) LLMs can retrieve data and information from legal documents; (j) appropriate prompt engineering does not always prevent hallucinations; (k) there is no single generative AI model that is superior or perfect for all legal problems; and (l) the latest-generation LLM is not always the most efficient for a given legal task.

Downloads

Download data is not yet available.

Author Biographies

  • Sérgio Rodrigo de Pádua, UniBrasil - Centro Universitário Autônomo do Brasil; Faculdade de Tecnologia de Curitiba (FATEC-PR)
    Doutorando e Mestre em Direitos Fundamentais e Democracia pelo UniBrasil - Centro Universitário Autônomo do Brasil. Professor na Faculdade de Tecnologia de Curitiba (FATEC-PR) - Direito Constitucional, Direito Administrativo e Teoria do Direito. Pesquisador na área de Direito, Tecnologia e Inteligência Artificial. Analista Judiciário do Tribunal de Justiça do Estado do Paraná (TJPR). Bolsista CAPES/PROSUP no Doutorado do PPGD do UniBrasil.
  • Fabiano Hartmann Peixoto, UNB, Brasília, DF.
    Doutor em Direito pela Universidade de Brasília; Professor permanente da Faculdade de Direito da Universidade de Brasília (graduação, mestrado acadêmico, mestrado profissional e doutorado),  Visiting Professor na Universidade de Montreal, Visiting Professor na Universidade de Ottawa, Pós-doc em Inteligência Artificial pela FLACSO, Líder do Laboratório de Pesquisa em Inteligência Artificial e Direito – DR.IA (www.dria.unb.br), bolsista CAPES, CNPq, FAPDF, PNUD; [email protected].

References

ABRAMSON, Josh et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, London, v. 630, p. 493-500, 2024. DOI: 10.1038/s41586-024-07487-w.

ALEXY, Robert. Direito, Razão, Discurso: Estudos para a filosofia do direito. Tradução: Luís Afonso Heck. 2ª ed. Porto Alegre: Livraria do Advogado, 2015.

ALEXY, Robert. Teoria dos Direitos Fundamentais. 2ª ed. Tradução: Virgílio Afonso da Silva. São Paulo: Malheiros, 2011.

ALIBABA. Qwen. [2025]. Disponível em: https://chat.qwenlm.ai. Acesso em: 12 fev. 2025.

ANGWIN, Julia et al. Machine Bias. [2016]. Disponível em: www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing. Acesso em: 28 nov. 2024.

ANTHROPIC. Building effective agents. [2024]. Disponível em: https://www.anthropic.com/research/building-effective-agents. Acesso em: 02 jan. 2025.

ANTHROPIC. Claude AI. [2025]. Disponível em: https://claude.ai. Acesso em: 31 mar. 2025.

ASHLEY, Kevin D. Artificial Intelligence and Legal Analytics: New tools for law practice in digital age. Cambridge: Cambridge University Press, 2017.

ASHLEY, Kevin D. Case-based reasoning and its implications for legal expert systems. Artificial Intelligence and Law, Dordrecht, v. 1, p. 113-208, 1992, DOI 10.1007/BF00114920.

BARBOZA, Estefânia Maria de Queiroz. Stare decisis, integridade e segurança jurídica: reflexões críticas a partir da aproximação dos sistemas de common law e civil law. 2010. Tese (Doutorado em Direito). Pontifícia Universidade Católica do Paraná (PUC-PR), Curitiba, 2010.

BROWN, Tom B. et al. Language Models are Few-Shot Learners. OpenAI, San Francisco, arXiv:2005.14165. Disponível em: https://arxiv.org/pdf/2005.14165.pdf. Acesso em: 07 abr. 2024.

BUYL, Maarten et al. Large Language Models Reflect the Ideology of Their Creators. Disponível em: https://arxiv.org/pdf/2005.14165. Acesso em: 16 nov. 2024.

CONSELHO NACIONAL DE JUSTIÇA. Resolução 615, de 11 de março de 2025. Estabelece diretrizes para o desenvolvimento, utilização e governança de soluções desenvolvidos com recursos de inteligência artificial no Poder Judiciário. Disponível em: https://atos.cnj.jus.br/atos/detalhar/6001. Acesso em: 26 mar. 2025.

CONSELHO FEDERAL DA ORDEM DOS ADVOGADOS DO BRASIL. Recomendação 001, de 11 de novembro de 2024. Apresenta diretrizes para orientar o uso de Inteligência Artificial generativa na Prática Jurídica. Disponível em: https://diario.oab.org.br/pages/materia/842347. Acesso em: 05 jan. 2025.

DEEPSEEK AI. DeepSeek. [2025]. Disponível em: https://www.deepseek.com. Acesso em: 08 fev. 2025.

DEEPSEEK AI. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. Disponível em: https://arxiv.org/pdf/2005.14165. Acesso em: 25 jan. 2025.

DWORKIN, Ronald. Levando os Direitos a Sério. 3.ª ed. Tradução: Nelson Boeira. São Paulo: Martins Fontes, 2010.

GOOGLE. Gemini. [2025]. Disponível em: https://gemini.google.com. Acesso em: 31 mar. 2025.

HARTMANN PEIXOTO, Fabiano; BONAT, Debora. GPTs e Direito: impactos prováveis das IAs generativas nas atividades jurídicas brasileiras. Seqüência, Florianópolis, v. 44, 2023. DOI: 10.5007/2177-7055.2023.e94238.

HARTMANN PEIXOTO, Fabiano; SILVA, Roberta Zumblick Martins da. Inteligência Artificial e Direito. Vol. 1. Curitiba: Alteridade, 2019.

HU, Mengya et al. SLM Meets LLM: Balancing Latency, Interpretability and Consistency in Hallucination Detection. Disponível em: https://arxiv.org/abs/2408.12748. Acesso em: 28 out. 2024.

KAPOOR, Sayash et al. AI Agents That Matter. Disponível em: https://arxiv.org/abs/2407.01502. Acesso em: 11 nov. 2024.

KURZWEIL, Ray. A Singularidade Está Mais Próxima: A fusão do ser humano com o poder da inteligência artificial. Tradução: Renato Marques. São Paulo: Goya, 2024.

LIU, Kai et al. Enhancing LLM’s Cognition via Structurization. Disponível em: https://arxiv.org/abs/2407.16434. Acesso em: 25 set. 2024.

MARITACA AI. Maritalk. [2025]. Disponível em: https://chat.maritaca.ai. Acesso em: 10 fev. 2025.

MICROSOFT. Copilot. [2025]. Disponível em: https://m365.cloud.microsoft. Acesso em: 15 jan. 2025. MICROSOFT. Copilot. [2025]. Disponível em: https://m365.cloud.microsoft. Acesso em: 15 jan. 2025.

MIGALHAS. Advogado virtual? ChatGPT consegue “aprovação” na primeira fase da OAB. [2023]. Disponível em https://www.migalhas.com.br/quentes/381875/advogado-virtual-chatgpt-consegue-aprovacao-na-primeira-fase-da-oab. Acesso em: 12 fev. 2025.

MORAIS, Fausto Santos de. Ponderação e arbitrariedade - A inadequada recepção de Alexy pelo STF. Editora Juspodium. 1a edição. 2016.

MORAIS, Fausto Santos de. O uso da inteligência artificial na repercussão geral: desafios teóricos e éticos. Revista Direito Público. Dossiê temático - “Inteligência Artificial, Ética e Epistemologia’, v. 18 n. 100. 2021. Disponível em https://www.portaldeperiodicos.idp.edu.br/direitopublico/article/view/6001. Acesso em: 12 fev. 2025.

OLIVEIRA, Bruno da Cunha de. Primeira IA capaz de ser aprovada no Enam é lançada no Brasil. [2024]. Disponível em: https://www.conjur.com.br/2024-ago-08/primeira-ia-capaz-de-ser-aprovada-no-enam-e-lancada-no-brasil/. Acesso em: 12 fev. 2025.

OPENAI. ChatGPT. [2025]. Disponível em: https://chatgpt.com. Acesso em: 15 mar. 2025.

PÁDUA, Sérgio Rodrigo de. Da Jurisdição ‘Ex Machina’ ao Juiz Ciborgue: Inteligência Artificial e Interpretação do Direito. São Paulo: Thomson Reuters, 2023.

PÁDUA, Sérgio Rodrigo de; LORENZETTO, Bruno Meneses. O Direito Fundamental à Explicabilidade da Inteligência Artificial Utilizada em Decisões Estatais. Revista da AGU, Brasília, v. 23, n. 02, 2024. DOI: 10.25109/2525-328X.v.23.n.02.2024.3480.

PERPLEXITY. Perplexity AI. [2025]. Disponível em: https://www.perplexity.ai. Acesso em: 16 jan. 2025.

ROVER, Aires José. Informática no Direito: Inteligência Artificial. Curitiba: Juruá, 2001.

SEARLE, Jonh R. Minds, brains, and programs. Behavioral and Brain Sciences, v. 3, n. 3, p. 417-424, 1980. DOI: 10.1017/S0140525X00005756.

SHANNON, Claude E. A Mathematical Theory of Communication. The Bell System Technical Journal, v. 27, n. 3, p. 379-423, Jul. 1948. DOI: 10.1002/j.1538-7305.1948.tb01338.x.

SUPERIOR TRIBUNAL DE JUSTIÇA. 1. Seção. Recurso Especial n.º 1.112.646/SP. Recurso repetitivo de Tema 174. Brasília, DF: Superior Tribunal de Justiça, [2009]. Relator: Min. Herman Benjamin, 26 de agosto de 2009. Disponível em: https://processo.stj.jus.br/SCON/GetInteiroTeorDoAcordao?num_registro=200900510886&dt_publicacao=28/08/2009.

SUPERIOR TRIBUNAL DE JUSTIÇA. 1. Turma. Agravo Interno no Agravo em Recurso Especial n.º 1.718.222/RJ. Brasília, DF: Superior Tribunal de Justiça, [2021]. Relator: Min. Gurgel de Faria, 14 de setembro de 2021. Disponível em: https://processo.stj.jus.br/SCON/GetInteiroTeorDoAcordao?num_registro=202001479104&dt_publicacao=17/09/2021. Acesso em: 15 jan. 2025.

SUPERIOR TRIBUNAL DE JUSTIÇA. Gabinetes conhecem, na prática, funcionamento do STJ Logos. [2025]. Disponível em: https://www.stj.jus.br/sites/portalp/Paginas/Comunicacao/Noticias/2025/15022025-Gabinetes-conhecem--na-pratica--funcionamento-do-STJ-Logos-.aspx. Acesso em: 17 fev. 2025.

SUPERIOR TRIBUNAL DE JUSTIÇA. Súmula 306 do STJ. Disponível em: https://www.stj.jus.br/docs_internet/revista/eletronica/stj-revista-sumulas-2011_24_capSumula306.pdf. Acesso em: 10 fev. 2025.

SUPERIOR TRIBUNAL DE JUSTIÇA. Súmula 326 do STJ. Disponível em: https://www.stj.jus.br/docs_internet/revista/eletronica/stj-revista-sumulas-2012_27_capSumula326.pdf. Acesso em: 10 fev. 2025.

SUPREMO TRIBUNAL FEDERAL. Plenário. Recurso Extraordinário n.º 1355208. Repercussão geral de Tema 1184. Brasília, DF: Superior Tribunal de Justiça, [2023]. Relatora: Min. Cármen Lúcia, 19 de dezembro de 2023. Disponível em: https://redir.stf.jus.br/paginadorpub/paginador.jsp?docTP=TP&docID=775641868.

SUPREMO TRIBUNAL FEDERAL. STF lança MARIA, ferramenta de inteligência artificial que dará mais agilidade aos serviços do Tribunal. [2024]. Disponível em: https://noticias.stf.jus.br/postsnoticias/stf-lanca-maria-ferramenta-de-inteligencia-artificial-que-dara-mais-agilidade-aos-servicos-do-tribunal/. Acesso em: 17 fev. 2025.

SUSSKIND, Richard. Tomorrow’s Lawyers: An Introduction to Your Future. 2a ed. Oxford: Oxford University Press, 2017. E-book Kindle.

VASWANI, Ashish et al. Attention Is All You Need. Disponível em: https://arxiv.org/abs/1706.03762. Acesso em: 12 dez. 2024.

XAI. Grok. [2025]. Disponível em: https://grok.com. Acesso em: 19 fev. 2025.

Published

2025-11-10

How to Cite

DE PÁDUA, Sérgio Rodrigo; PEIXOTO, Fabiano Hartmann. Generative Artificial Intelligence in law: from evaluation methodology to the legal correctness of LLMS and AI agents. Revista Brasileira de Direito, Passo Fundo, RS, Brasil, v. 21, n. 1, p. e5237, 2025. DOI: 10.18256/g4jnx825. Disponível em: https://seer.atitus.edu.br/index.php/revistadedireito/article/view/5237. Acesso em: 28 dec. 2025.