Photoroomμ Text-to-Image λͺ¨λΈ νμ΅ μ€κ³: Ablation μ€νμμ μ»μ κ΅ν.
5 sources
51 new posts
π AI λͺ¨λΈ λ²€μΉλ§ν¬
π₯οΈ Terminal-Bench 2.0 (Top 5)
π Chatbot Arena ELO (Top 5)
Source: Chatbot Arena
π§ ARC-AGI-2 λ¬μ±λ₯
π€ 84.6% β Gemini 3 Deep Think (Google)
π§ Human Panel = 100% κΈ°μ€
Source: ARC Prize Leaderboard
β μ 체 보기
π Company News×
μ΄ 51건 Β· νμ΄μ§ 2/3
DeepSeekλΆν° AI+κΉμ§, κΈλ‘λ² μ€νμμ€ AI μνκ³μ λ―Έλμ λν Hugging Face λΈλ‘κ·Έ.
H Companyμ Holo2 λͺ¨λΈμ΄ UI Localization λΆμΌμμ μ λλ₯Ό μ°¨μ§νλ€.
Daggr μκ°: μ±μ νλ‘κ·Έλλ° λ°©μμΌλ‘ 체μ΄λνκ³ μκ°μ μΌλ‘ κ²μ¬νλ λꡬ.
Google AI Ultra ꡬλ
μ(λ―Έκ΅)κ° λ¬΄ννκ³ μΈν°λν°λΈν μΈκ³λ₯Ό μμ±νκ³ ννν μ μλ μ€νμ μ°κ΅¬ νλ‘ν νμ
Project Genieλ₯Ό 체νν μ μλ€.
Claudeλ₯Ό νμ©νμ¬ CUDA 컀λμ λΉλνκ³ μ€ν λͺ¨λΈμ κ°λ₯΄μΉλ λ°©λ².
LinkedInμ GPT-OSSλ₯Ό μν μμ΄μ νΈ RL νμ΅ μ€μ νκ³ λ‘.
26.01.27
Hugging Face Blog
Alyah βοΈ: Toward Robust Evaluation of Emirati Dialect Capabilities in Arabic LLMs
TIIμ Alyah: μλμ΄ LLMμμ μλ―ΈλΌν° λ°©μΈ λ₯λ ₯μ κ²¬κ³ νκ² νκ°νκΈ° μν μ°κ΅¬.
26.01.27
Hugging Face Blog
Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek
DeepSeekμ λμ΄μ μ€κ΅ μ€νμμ€ AI μνκ³μ μν€ν
μ² μ νμ λν Hugging Face λΆμ.
26.01.21
Hugging Face Blog
AssetOpsBench: Bridging the Gap Between AI Agent Benchmarks and Industrial Reality
IBM Researchμ AssetOpsBench: AI μμ΄μ νΈ λ²€μΉλ§ν¬μ μ°μ
νμ€ κ°μ 격차λ₯Ό ν΄μ.
4D μ₯λ©΄ 볡μκ³Ό μΆμ μ μν ν΅ν© AI λͺ¨λΈ D4RT μκ°. AIμκ² μΈκ³λ₯Ό 4μ°¨μμΌλ‘ 보λ λ²μ κ°λ₯΄μΉλ€.
Veo 3.1 μ
λ°μ΄νΈ: μμ°μ€λ½κ³ μλμ μΈ ν΄λ¦½ μμ± λ° μΈλ‘ μμ μ§μ. λ λ§μ μΌκ΄μ±, μ°½μμ±, μ μ΄λ ₯μ μ 곡νλ€.
Google 2025λ
리뷰: 8κ° λΆμΌμ μ°κ΅¬ λνꡬ μμ½.
Gemini 3 Flash: λΉμ©μ μΌλΆλ‘ μ΅μ²¨λ¨ μ§λ₯κ³Ό μλλ₯Ό μ 곡νλ νλ‘ ν°μ΄ λͺ¨λΈ.
25.12.16
Google DeepMind
Gemma Scope 2: helping the AI safety community deepen understanding of complex language model behavior
Gemma 3 μ νκ΅°μ μν ν¬κ΄μ μ€ν ν΄μκ°λ₯μ± λꡬ λͺ¨μ Gemma Scope 2 λ°ν. AI μμ μ°κ΅¬λ₯Ό κ°μννκΈ° μν΄ λ³΅μ‘ν μΈμ΄ λͺ¨λΈ λμμ μ΄ν΄λ₯Ό λλλ€.
κ°μ λ Gemini μ€λμ€ λͺ¨λΈλ‘ κ°λ ₯ν μμ± κ²½νμ μ 곡νλ€.
Google DeepMindμ μκ΅ AI Security Institute(AISI)κ° μλ‘μ΄ μ°κ΅¬ ννΈλμμ ν΅ν΄ AI μΆλ‘ λͺ¨λν°λ§, μ¬νκ²½μ μ μν₯ νκ° λ± ν΅μ¬ μμ μ°κ΅¬ λΆμΌμμ νλ ₯μ κ°ννλ€.
25.12.09
Google DeepMind
FACTS Benchmark Suite: Systematically evaluating the factuality of large language models
FACTS Benchmark Suite: LLMμ μ¬μ€μ±μ λ§€κ°λ³μ, κ²μ, λ©ν°λͺ¨λ¬ μΆλ‘ 3κ° μμμμ 체κ³μ μΌλ‘ νκ°νλ λ²€μΉλ§ν¬.
κ³Όνμλ€μ΄ AlphaFoldλ₯Ό μ¬μ©νμ¬ κ΄ν©μ± ν¨μ(GLYK)λ₯Ό κ°ννκ³ , μ¨λνμ μ μν μ μλ λ ν볡λ ₯ μκ³ λ΄μ΄μ± μλ μλ¬Όμ κ°λ°νλ κΈΈμ μ΄κ³ μλ€.
κ³Όνμλ€μ΄ AlphaFoldλ₯Ό μ¬μ©νμ¬ μ¬μ₯λ³μ ν΅μ¬ λ¨λ°±μ§μ λ§€ννκ³ , μ΄ λνκ΅¬κ° μΉλ£λ²μ μ΄λ»κ² λ³νμν¬ μ μλμ§ νꡬνλ€.