Compartir

16 de mayo de 2025

Harvey: Validación del razonamiento legal avanzado de la versión preliminar de Gemini 2.5 Pro con BigLaw Bench

Niko Grupen

Jefe de IA aplicada

Vishal Dharmadhikari

DevRel de IA

Hero de Toonsutra

La industria legal exige soluciones de IA que puedan navegar por un volumen inmenso de información compleja con precisión y matices. Los comparativas tradicionales de IA suelen no captar las demandas de la práctica legal en el mundo real, lo que dificulta la identificación de modelos realmente capaces de realizar trabajos legales de alto valor. Harvey, una startup dinámica dedicada a transformar los flujos de trabajo legales a través de la IA, abordó este problema desarrollando BigLaw Bench, su framework integral para evaluar el rendimiento de los modelos de lenguaje grandes (LLM) en tareas que reflejan el trabajo legal real. En sus evaluaciones rigurosas recientes, la versión preliminar de Gemini 2.5 Pro se destacó por su rendimiento y demostró un potencial excepcional para mejorar la eficiencia en dominios legales clave.

Gemini 2.5 Pro Preview lidera en BigLaw Bench

Las evaluaciones recientes de Harvey que aprovechan el marco de trabajo de BigLaw Bench indicaron claramente que la versión preliminar de Gemini 2.5 Pro demuestra una competencia notable en las tareas principales de razonamiento legal y, en particular, en las tareas que requieren razonamiento sobre entradas o salidas legales de formato largo. Como se muestra en los resultados que Harvey compartió públicamente, obtenidos a través de pruebas de modelos, incluida la versión preliminar de Gemini 2.5 Pro, a través de sus respectivas APIs, la versión preliminar de Gemini 2.5 Pro obtuvo la puntuación más alta de 85.02% en BigLaw Bench, superando a otros modelos evaluados en esta evaluación integral.

Texto alternativo: Gráfico de barras con el título

Esta capacidad líder es fundamental para una amplia variedad de actividades legales de alto valor. Las tareas de evaluación clave de BigLaw Bench mostraron las fortalezas de la versión preliminar de Gemini 2.5 Pro:

  • Diligencia debida de transacciones: La versión preliminar de Gemini 2.5 Pro mostró una gran capacidad para extraer y resumir las disposiciones fundamentales (p.ej., cesión, indemnización, cláusulas de rescisión) de varios contratos de servicio extensos. Esto sugiere un potencial significativo para optimizar el proceso de revisión manual de documentos, que requiere mucho tiempo.
  • Estructuración de transacciones: El modelo generó con habilidad análisis comparativos integrales y bien estructurados de opciones financieras complejas (p.ej., PIPE, ofertas de acciones suscritas, ofertas de bonos). El modelo demostró ser prometedor para presentar esta información de una manera clara y accesible, incluso para quienes no tienen conocimientos financieros profundos, y para sugerir posibles medidas inmediatas.
  • Escritura de litigios: Cuando se evaluó en tareas relacionadas con litigios, la Versión preliminar de Gemini 2.5 Pro mostró una capacidad notable para generar esquemas detallados de informes legales basados en volúmenes considerables de documentos de informes. Esta capacidad apunta a un futuro en el que la IA puede ayudar de manera significativa en las etapas iniciales del desarrollo y la organización de argumentos legales.
  • Revisión y análisis de documentos: Las evaluaciones que implicaron la revisión de documentos de prueba dispares (registros de llamadas, correos electrónicos y memorandos) revelaron la fortaleza de la versión preliminar de Gemini 2.5 Pro para crear resúmenes cronológicos coherentes de los eventos. Además, el modelo mostró potencial para identificar incoherencias y ambigüedades críticas dentro del registro, un aspecto fundamental de un análisis legal exhaustivo.


En estas evaluaciones, la versión preliminar de Gemini 2.5 Pro mostró un razonamiento sólido en las entradas que consistían en cientos de páginas de materiales, una situación común en el trabajo legal. Además, pudo usar estos materiales para generar resultados más extensos y completos, lo que permitió obtener estadísticas y análisis más detallados. Estas capacidades principales destacan el potencial de aprovechar la versión preliminar de Gemini 2.5 Pro en trabajos legales complejos que requieren razonamiento sobre grandes conjuntos de documentos para respaldar la diligencia, la revisión y la redacción de casos de uso.

"En Harvey, nos comprometemos a equipar a los profesionales legales con las herramientas más avanzadas", afirma Niko Grupen, director de IA aplicada en Harvey. “Nuestra evaluación de la versión preliminar de Gemini 2.5 Pro a través de BigLaw Bench reveló su notable capacidad para sintetizar información legal compleja. Esta información alimenta nuestra visión para el desarrollo de productos futuros, en la que buscamos aprovechar estas fortalezas para lograr una eficiencia sin precedentes y permitir que los abogados se enfoquen en el trabajo estratégico de nivel superior".

El compromiso de Harvey con la evaluación rigurosa y su análisis perspicaz de modelos de IA de vanguardia, como la versión preliminar de Gemini 2.5 Pro, demuestran el potencial transformador de la IA en el campo legal. Sus conclusiones allanan el camino para futuras innovaciones que prometen reformular la forma en que los profesionales legales abordan sus tareas más exigentes.

Para explorar cómo las capacidades avanzadas de razonamiento y síntesis de la Versión preliminar de Gemini 2.5 Pro pueden potenciar tus propias aplicaciones, visita la documentación de la API de Gemini o comienza a usar Google AI Studio.

Harvey participa en el Fondo de Futuros de IA de Google, que invierte en startups ambiciosas y colabora con ellas para desarrollar lo próximo en IA.