Chia sẻ

Ngày 16 tháng 5 năm 2025

Harvey: Xác thực tính năng Suy luận pháp lý nâng cao của bản xem trước Gemini 2.5 Pro bằng BigLaw Bench

Niko Grupen

Trưởng bộ phận Trí tuệ nhân tạo ứng dụng

Vishal Dharmadhikari

AI DevRel

Nhân vật chính trong bản minh hoạ của Toonsutra

Ngành pháp lý đòi hỏi các giải pháp AI có thể xử lý một lượng lớn thông tin phức tạp một cách chính xác và tinh tế. Các điểm chuẩn AI truyền thống thường không đáp ứng được nhu cầu thực tế của hoạt động thực hành pháp lý, khiến việc xác định các mô hình thực sự có khả năng thực hiện công việc pháp lý có giá trị cao trở nên khó khăn. Harvey, một công ty khởi nghiệp năng động chuyên về việc chuyển đổi quy trình làm việc pháp lý thông qua AI, đã giải quyết vấn đề này bằng cách phát triển BigLaw Bench, một khung toàn diện để đánh giá hiệu suất của Mô hình ngôn ngữ lớn (LLM) trên các nhiệm vụ phản ánh công việc pháp lý thực tế. Trong các bài đánh giá nghiêm ngặt gần đây, Gemini 2.5 Pro Preview đã trở thành một mô hình hoạt động nổi bật, thể hiện tiềm năng đặc biệt để cải thiện hiệu quả trong các lĩnh vực pháp lý chính.

Bản xem trước Gemini 2.5 Pro dẫn đầu trên BigLaw Bench

Các đánh giá gần đây của Harvey dựa trên khung BigLaw Bench đã chỉ ra rõ ràng rằng Bản dùng thử Gemini 2.5 Pro thể hiện trình độ chuyên môn đáng kể trong các nhiệm vụ suy luận pháp lý cốt lõi, đặc biệt là các nhiệm vụ đòi hỏi suy luận về đầu vào hoặc đầu ra pháp lý dài. Như trong kết quả được Harvey chia sẻ công khai, thu được bằng cách kiểm thử các mô hình bao gồm cả Bản dùng thử Gemini 2.5 Pro thông qua các API tương ứng, Bản dùng thử Gemini 2.5 Pro đã đạt được điểm số cao nhất là 85,02% trên BigLaw Bench, vượt trội so với các mô hình khác được đánh giá trong quy trình đánh giá toàn diện này.

Văn bản thay thế: Biểu đồ thanh có tiêu đề

Khả năng hàng đầu này rất quan trọng đối với nhiều hoạt động pháp lý có giá trị cao. Các nhiệm vụ đánh giá chính trong BigLaw Bench đã cho thấy những điểm mạnh của Bản xem trước Gemini 2.5 Pro:

  • Thẩm định kỹ lưỡng giao dịch: Bản dùng thử Gemini 2.5 Pro cho thấy khả năng trích xuất và tóm tắt các điều khoản quan trọng (ví dụ: uỷ quyền, bồi thường, các điều khoản chấm dứt) từ nhiều thoả thuận dịch vụ dài dòng. Điều này cho thấy tiềm năng đáng kể để đơn giản hoá quy trình xem xét tài liệu thủ công tốn nhiều thời gian.
  • Lập cấu trúc giao dịch: Mô hình này đã tạo ra các bản phân tích so sánh toàn diện, có cấu trúc tốt về các lựa chọn tài chính phức tạp (ví dụ: PIPE, phát hành cổ phần được bảo lãnh, phát hành trái phiếu). Mô hình này hứa hẹn sẽ trình bày thông tin này một cách rõ ràng và dễ hiểu, ngay cả đối với những người không có chuyên môn tài chính sâu rộng, đồng thời đề xuất các hành động tiềm năng cần thực hiện ngay lập tức.
  • Soạn thảo tài liệu tố tụng: Khi được đánh giá về các nhiệm vụ liên quan đến tố tụng, bản dùng thử Gemini 2.5 Pro cho thấy khả năng đáng kể trong việc tạo dàn ý chi tiết cho các bản tóm tắt pháp lý dựa trên số lượng lớn tài liệu tóm tắt. Khả năng này cho thấy một tương lai mà AI có thể hỗ trợ đáng kể trong các giai đoạn đầu của quá trình phát triển và sắp xếp lập luận pháp lý.
  • Xem xét và phân tích tài liệu: Các hoạt động đánh giá liên quan đến việc xem xét các tài liệu thử nghiệm khác nhau (nhật ký cuộc gọi, email, bản ghi nhớ) đã cho thấy điểm mạnh của Gemini 2.5 Pro Preview trong việc tạo bản tóm tắt theo trình tự thời gian nhất quán về các sự kiện. Hơn nữa, mô hình này cho thấy tiềm năng trong việc xác định những điểm không nhất quán và mơ hồ quan trọng trong hồ sơ, một khía cạnh quan trọng của việc phân tích pháp lý kỹ lưỡng.


Trong các lần đánh giá này, Bản xem trước Gemini 2.5 Pro đã thể hiện khả năng suy luận mạnh mẽ trên các dữ liệu đầu vào bao gồm hàng trăm trang tài liệu, một tình huống phổ biến trong công việc pháp lý. Ngoài ra, công cụ này có thể sử dụng những tài liệu này để tạo ra kết quả dài hơn và toàn diện hơn, cho phép phân tích và hiểu biết chuyên sâu hơn. Những khả năng cốt lõi này cho thấy tiềm năng khai thác tính năng Xem trước Gemini 2.5 Pro trong các công việc pháp lý phức tạp đòi hỏi phải suy luận trên các tập tài liệu lớn để hỗ trợ các trường hợp sử dụng như cẩn trọng, xem xét và soạn thảo.

"Tại Harvey, chúng tôi cam kết trang bị cho các chuyên gia pháp lý những công cụ tiên tiến nhất", Niko Grupen, Trưởng bộ phận AI ứng dụng tại Harvey, cho biết. "Kết quả đánh giá của chúng tôi về Bản dùng thử Gemini 2.5 Pro thông qua BigLaw Bench cho thấy khả năng tổng hợp thông tin pháp lý phức tạp của mô hình này. Thông tin chi tiết này thúc đẩy tầm nhìn của chúng tôi về việc phát triển sản phẩm trong tương lai. Chúng tôi muốn tận dụng những thế mạnh này để đạt được hiệu quả chưa từng có và giúp các luật sư tập trung vào công việc chiến lược ở cấp cao hơn".

Cam kết của Harvey về việc đánh giá nghiêm ngặt và phân tích sâu sắc về các mô hình AI tiên tiến như Gemini 2.5 Pro Preview đang minh chứng cho tiềm năng biến đổi của AI trong lĩnh vực pháp lý. Phát hiện của họ mở đường cho những đổi mới trong tương lai, hứa hẹn sẽ định hình lại cách các chuyên gia pháp lý tiếp cận những nhiệm vụ đòi hỏi nhiều công sức nhất.

Để khám phá cách các tính năng tổng hợp và suy luận nâng cao của Bản dùng thử Gemini 2.5 Pro có thể hỗ trợ các ứng dụng của riêng bạn, hãy truy cập vào tài liệu về Gemini API hoặc bắt đầu trong Google AI Studio.

Harvey là một thành viên tham gia Quỹ tương lai về AI của Google. Quỹ này đầu tư và cộng tác với các công ty khởi nghiệp đầy tham vọng để xây dựng những công nghệ AI tiếp theo.