π AI λͺ¨λΈ λ²€μΉλ§ν¬
βΌ
π₯οΈ Terminal-Bench 2.0 (Top 5)
π Chatbot Arena ELO (Top 5)
π§ ARC-AGI-2 λ¬μ±λ₯
π€ 84.6% β Gemini 3 Deep Think (Google)
π§ Human Panel = 100% κΈ°μ€
μ΄ 3건
β² 0
OpenEnv: μ€μ νκ²½μμ λꡬ μ¬μ© μμ΄μ νΈλ₯Ό νκ°νλ μ°κ΅¬. μ€νμμ€μ μ€ν μ¬μ΄μΈμ€λ₯Ό ν΅ν AI λ°μ .
β² 0
μμ΄μ νΈ νΌμ€νΈ μΈκ³μμ Codexλ₯Ό νμ©ν΄ μλ μμ± μ½λ 0μ€λ‘ μννΈμ¨μ΄ μ νμ λ΄λΆ λ² νλ₯Ό ꡬμΆνκ³ μΆμν μ¬λ‘.
β² 0
Gemini 3 Deep Thinkκ° μ΅μ²¨λ¨ μΆλ‘ λ₯λ ₯μΌλ‘ κ³Όν, μ°κ΅¬, μμ§λμ΄λ§ λΆμΌμ λ°μ μ κ°μννλ€.