Daggr μκ°: μ±μ νλ‘κ·Έλλ° λ°©μμΌλ‘ 체μ΄λνκ³ μκ°μ μΌλ‘ κ²μ¬νλ λꡬ.
5 sources
14 new posts
π AI λͺ¨λΈ λ²€μΉλ§ν¬
π₯οΈ Terminal-Bench 2.0 (Top 5)
π Chatbot Arena ELO (Top 5)
Source: Chatbot Arena
π§ ARC-AGI-2 λ¬μ±λ₯
π€ 84.6% β Gemini 3 Deep Think (Google)
π§ Human Panel = 100% κΈ°μ€
Source: ARC Prize Leaderboard
β μ 체 보기
π
2026-01×
μ΄ 14건
Google AI Ultra ꡬλ
μ(λ―Έκ΅)κ° λ¬΄ννκ³ μΈν°λν°λΈν μΈκ³λ₯Ό μμ±νκ³ ννν μ μλ μ€νμ μ°κ΅¬ νλ‘ν νμ
Project Genieλ₯Ό 체νν μ μλ€.
Claudeλ₯Ό νμ©νμ¬ CUDA 컀λμ λΉλνκ³ μ€ν λͺ¨λΈμ κ°λ₯΄μΉλ λ°©λ².
LinkedInμ GPT-OSSλ₯Ό μν μμ΄μ νΈ RL νμ΅ μ€μ νκ³ λ‘.
26.01.27
Hugging Face Blog
Alyah βοΈ: Toward Robust Evaluation of Emirati Dialect Capabilities in Arabic LLMs
TIIμ Alyah: μλμ΄ LLMμμ μλ―ΈλΌν° λ°©μΈ λ₯λ ₯μ κ²¬κ³ νκ² νκ°νκΈ° μν μ°κ΅¬.
26.01.27
Hugging Face Blog
Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek
DeepSeekμ λμ΄μ μ€κ΅ μ€νμμ€ AI μνκ³μ μν€ν
μ² μ νμ λν Hugging Face λΆμ.
λͺ¨λ μμ΄μ νΈ μ½λλ² μ΄μ€μ μμ΄μΌ ν νλμ ν둬ννΈ. μμ§λμ΄λ§ νμ μν κ°μ΄λ.
Joma Techμ ν¬μ€ν
νμ§ μλ μ΄μ μ μ μ±λ μκ° μμ.
26.01.21
Hugging Face Blog
AssetOpsBench: Bridging the Gap Between AI Agent Benchmarks and Industrial Reality
IBM Researchμ AssetOpsBench: AI μμ΄μ νΈ λ²€μΉλ§ν¬μ μ°μ
νμ€ κ°μ 격차λ₯Ό ν΄μ.
μλμ΄ μμ§λμ΄λ€μ΄ κ³μ λμΉλ Claude Code κΈ°λ₯ μκ°.
4D μ₯λ©΄ 볡μκ³Ό μΆμ μ μν ν΅ν© AI λͺ¨λΈ D4RT μκ°. AIμκ² μΈκ³λ₯Ό 4μ°¨μμΌλ‘ 보λ λ²μ κ°λ₯΄μΉλ€.
Veo 3.1 μ
λ°μ΄νΈ: μμ°μ€λ½κ³ μλμ μΈ ν΄λ¦½ μμ± λ° μΈλ‘ μμ μ§μ. λ λ§μ μΌκ΄μ±, μ°½μμ±, μ μ΄λ ₯μ μ 곡νλ€.
Agent Threads: Boris Chernyμ²λΌ λ°°ν¬νλ λ°©λ²κ³Ό Claude Codeμμμ Ralph Wiggum.
Claude Codeκ° νλ‘λμ
μ μμ ν λκΉμ§λ νλ₯νλ€λ κ²½νλ΄.