SPILLage: LLM κΈ°λ° μΉ μμ΄μ νΈκ° μ¬μ©μ 리μμ€(μ΄λ©μΌ, μΊλ¦°λ λ±)λ₯Ό μ 3μμκ² κ³Όλνκ² κ³΅μ νλ μμ΄μ νΈ μ€λ²μ
°μ΄λ§ λ¬Έμ λ₯Ό 곡μννκ³ λΆμν μ°κ΅¬.
5 sources
2 new posts
π AI λͺ¨λΈ λ²€μΉλ§ν¬
π₯οΈ Terminal-Bench 2.0 (Top 5)
π Chatbot Arena ELO (Top 5)
Source: Chatbot Arena
π§ ARC-AGI-2 λ¬μ±λ₯
π€ 84.6% β Gemini 3 Deep Think (Google)
π§ Human Panel = 100% κΈ°μ€
Source: ARC Prize Leaderboard
μ΄ 2건
3B νλΌλ―Έν°λ§μΌλ‘ μμ΄μ νΈ νλ, μ½λ μμ±, μΌλ° μΆλ‘ μ λμμ λ¬μ±νλ ν΅ν© λ²μ© μΈμ΄ λͺ¨λΈ Nanbeige4.1-3B λ°ν. μ΅μ΄μ μ€νμμ€ μν μΈμ΄ λͺ¨λΈ(SLM)λ‘μ μ΄λ¬ν λ€μ¬λ€λ₯ν¨μ μ€ννλ€.