AI Digest by Angtiger

2026-02-17 21:23 KST · by Angtiger · 매일 10:00 KST 업데이트

5 sources

1 new posts

🔍 검색 · · · 📧 무료구독

← 전체 보기 📅 2025-12-09

총 1건

25.12.09 Google DeepMind FACTS Benchmark Suite: Systematically evaluating the factuality of large language models

▲ 0

FACTS Benchmark Suite: LLM의 사실성을 매개변수, 검색, 멀티모달 추론 3개 영역에서 체계적으로 평가하는 벤치마크.