AI Digest by Angtiger

2026-02-17 23:59 KST · by Angtiger · 매일 08:00 KST 업데이트

17 sources

65 new posts

🔍 검색 · · · 📧 무료구독

📧 무료구독하기

🏆 AI 모델 벤치마크

▼

🖥 Terminal-Bench 2.0 (Top 5)

Source: Terminal-Bench · Anthropic · OpenAI

🏆 Chatbot Arena ELO (Top 5)

Source: Chatbot Arena

🧠 ARC-AGI-2 달성률

84.6%

🤖 84.6% — Gemini 3 Deep Think (Google) 🧑 Human Panel = 100% 기준

Source: ARC Prize Leaderboard

← 전체 보기 📅 2026-02

총 65건 · 페이지 2/4

26.02.15 HF Daily Papers STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts

▲ 0

STATe-of-Thoughts: 고수준 추론 패턴을 탐색하는 해석 가능한 Inference-Time-Compute 방법. 기존 Tree-of-Thoughts의 다양성 부족 문제를 구조화된 액션 템플릿으로 해결한다.

26.02.14 Y Combinator The New Way To Build A Startup

▲ 0

스타트업을 만드는 새로운 방법에 대한 영상.

26.02.13 vibenote from subinium Anthropic (@AnthropicAI) on X

▲ 0

Anthropic 공식 계정의 X(Twitter) 포스트.

26.02.13 비즈까페 (BZCF) "내 말 들으라고" (블랙록 래리핑크)

▲ 0

BlackRock 래리 핑크의 메시지에 대한 영상.

26.02.13 HF Daily Papers SPILLage: Agentic Oversharing on the Web

▲ 0

SPILLage: LLM 기반 웹 에이전트가 사용자 리소스(이메일, 캘린더 등)를 제3자에게 과도하게 공유하는 에이전트 오버셰어링 문제를 공식화하고 분석한 연구.

26.02.13 OpenAI Blog Introducing GPT-5.3-Codex-Spark

▲ 0

GPT-5.3-Codex-Spark 리서치 프리뷰 출시. GPT-5.3-Codex의 소형 버전으로 실시간 코딩을 위해 설계된 최초의 모델.

26.02.13 OpenAI Blog Beyond rate limits: scaling access to Codex and Sora

▲ 0

Codex와 Sora의 사용량이 원래 예상을 초과함에 따라 속도 제한을 넘어 접근성을 확대한다.

26.02.13 OpenAI Blog Scaling social science research

▲ 0

연구자들이 정성적 데이터를 분석 가능한 수치로 변환하는 새로운 도구 소개. 과학자들이 더 빠르게 이동하고 더 어려운 문제를 해결할 수 있도록 지원한다.

26.02.13 HF Daily Papers Nanbeige4.1-3B: A Small General Model that Reasons, Aligns, and Acts

▲ 0

3B 파라미터만으로 에이전트 행동, 코드 생성, 일반 추론을 동시에 달성하는 통합 범용 언어 모델 Nanbeige4.1-3B 발표. 최초의 오픈소스 소형 언어 모델(SLM)로서 이러한 다재다능함을 실현했다.

26.02.13 Hugging Face Blog Custom Kernels for All from Codex and Claude

▲ 0

Codex와 Claude를 활용한 커스텀 커널 개발의 민주화. 오픈소스와 오픈 사이언스를 통해 AI를 발전시키고 대중화하는 여정.

26.02.13 OpenAI Blog Introducing Lockdown Mode and Elevated Risk labels in ChatGPT

▲ 0

ChatGPT에 Lockdown Mode와 Elevated Risk 라벨 도입. AI 시스템이 웹과 연결된 앱에서 복잡한 작업을 수행하면서 prompt injection 공격 등 보안 위험이 증가하고 있다.

26.02.12 vibenote from subinium OpenAI Developers (@OpenAIDevs) on X

▲ 0

OpenAI Developers 공식 계정의 X(Twitter) 포스트.

26.02.12 vibenote from subinium Google Gemini (@GeminiApp) on X

▲ 0

Google Gemini 공식 계정의 X(Twitter) 포스트.

26.02.12 비즈까페 (BZCF) "싱가포르가 성공한 이유" (리콴유)

▲ 0

리콴유가 말하는 싱가포르 성공 비결 영상.

26.02.12 Hugging Face Blog OpenEnv in Practice: Evaluating Tool-Using Agents in Real-World Environments

▲ 0

OpenEnv: 실제 환경에서 도구 사용 에이전트를 평가하는 연구. 오픈소스와 오픈 사이언스를 통한 AI 발전.

26.02.12 OpenAI Blog Harness engineering: leveraging Codex in an agent-first world

▲ 0

에이전트 퍼스트 세계에서 Codex를 활용해 수동 작성 코드 0줄로 소프트웨어 제품의 내부 베타를 구축하고 출시한 사례.

26.02.12 Google DeepMind Gemini 3 Deep Think: Advancing science, research and engineering

▲ 0

Gemini 3 Deep Think가 최첨단 추론 능력으로 과학, 연구, 엔지니어링 분야의 발전을 가속화한다.

26.02.11 비즈까페 (BZCF) 1시간 볼만한 가치 있다 (a16z 풀인터뷰)

▲ 0

a16z 풀인터뷰: 1시간 볼만한 가치가 있는 대담.

26.02.11 OpenAI Blog Testing ads in ChatGPT

▲ 0

ChatGPT에 광고 테스트 시작. 미국 내 Free 및 Go 티어의 로그인 성인 사용자 대상. Plus, Pro, Business, Enterprise, Education 티어에는 광고가 표시되지 않는다.

26.02.11 HF Daily Papers DeepImageSearch: Benchmarking Multimodal Agents for Context-Aware Image Retrieval in Visual Histories

▲ 0

DeepImageSearch: 시각적 히스토리에서 컨텍스트 인식 이미지 검색을 위한 멀티모달 에이전트 벤치마크. 이미지 검색을 자율 탐색 과제로 재정의하는 새로운 에이전트 패러다임을 제시한다.

«‹ 이전 1 2 3 4 다음 ›»