데이터샤우츠

[2026-06-02 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 본문

AI

[2026-06-02 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리

gibdata 2026. 6. 2. 18:03
반응형

🏢 AI 기업·비즈니스 (10건)

1. 엔비디아, 마이크로소프트·델·HP와 손잡고 2,000억 달러 규모 AI 에이전트 PC 시장 공략

엔비디아(Nvidia)가 대만 타이베이에서 열린 컴퓨텍스(Computex) 행사에서 인공지능 에이전트(AI agent)를 구동하는 새로운 중앙처리장치(central processing unit, CPU)인 ‘RTX 스파크(RTX Spark)‘를 공개했다. RTX 스파크는 1페타플롭스(1 petaflop)의 연산 능력을 갖춘 슈퍼칩(superchip)이다. 마이크로소프트(Microsoft)와 공동 개발한 보안 샌드박스(sandbox)를 탑재해 인공지능 에이전트를 안전하게 실행한다. 충분한 하드웨어 성능과 엔비디아의 쿠다(Compute Unified Device Architecture, CUDA) 소프트웨어를 바탕으로 기기 자체에서 거대 언어모델(large language model, LLM)을 실행할 수 있다. 에이수스(ASUS), 델(Dell), 에이치피(HP), 레노버(Lenovo), 마이크로소프트 서피스(Microsoft Surface), 엠에스아이(MSI) 등 주요 제조사가 이번 가을부터 RTX 스파크를 탑재한 인공지능 개인용 컴퓨터(AI personal computer, AI PC)를 출시할 예정이다. 엔비디아는 RTX 스파크를 콘텐츠 창작자와 게이머를 위한 제품으로 홍보하고 있으며, 100개 이상의 윈도우(Windows) 소프트웨어 개발사가 지원을 약속했다. 젠슨 황(Jensen Huang) 최고경영자(Chief Executive Officer, CEO)는 사용자가 지시하면 컴퓨터가 작업을 수행하는 새로운 컴퓨터 사용 방식을 제시했다. 엔비디아는 주력 제품인 그래픽처리장치(graphics processing unit, GPU) 외에도 2,000억 달러 규모의 CPU 시장을 적극 공략하고 있다. 올해 초 출시한 서버용 CPU인 베라(Vera)는 이미 200억 달러의 매출을 기록했다. 2013년 마이크로소프트가 엔비디아의 에이알엠(Advanced RISC Machine, ARM) 기반 칩을 탑재한 서피스 RT 사업에서 큰 손실을 기록한 바 있으나, 엔비디아는 최근의 기록적인 매출 성장을 발판 삼아 CPU 시장 진출을 다시 추진하고 있다. 새로운 PC 시스템은 엔비디아가 개발자에게 판매하던 미니 컴퓨터인 ‘DGX 스파크(DGX Spark)‘의 소비자용 버전으로 추정된다. 맥 미니(Mac Mini)처럼 인공지능 에이전트 구동을 위해 흔히 쓰이는 소형 기기와 가격 경쟁을 벌일지, 혹은 고가형 시장을 공략할지는 지켜봐야 할 대목이다.

기사원문 바로가기

 

Nvidia chases $200B CPU market with AI agent PCs from Microsoft, Dell, and HP | TechCrunch

If Nvidia has cracked a way to bring AI agents easily, safely, and usefully to the masses, it could — and should — be big.

techcrunch.com

 

2. 인공지능 연구소 앤스로픽, 1조 달러 규모 비공개 기업공개 절차 착수

앤스로픽(Anthropic)이 미국 증권거래위원회(Securities and Exchange Commission, SEC)에 비공개로 기업공개(initial public offering, IPO) 등록 초안을 제출했다. 기업 가치가 1조 달러에 육박하는 앤스로픽은 주식 수와 공모가를 아직 확정하지 않았으며 공모 일정은 시장 상황에 따라 달라진다. 비공개 신청 제도를 이용하면 기업은 재무 정보나 위험 요인을 대중에 노출하지 않고 기업공개를 준비할 수 있다. 기업공개 절차를 본격적으로 밟으면 앤스로픽은 재무 상태와 의결권 지분 구조를 담은 S-1 등록 서류(S-1 registration statement)를 공개해야 한다. 이번 비공개 신청에 앞서 앤스로픽은 얼티미터 캐피탈(Altimeter Capital)과 세쿼이아 캐피탈(Sequoia Capital) 등이 참여한 시리즈 H(Series H) 투자를 유치하는 과정에서 650억 달러를 조달하며 기업 가치 9650억 달러를 달성했다. 경쟁사인 오픈에이아이(OpenAI) 역시 지난 3월에 1220억 달러를 유치하며 기업 가치 8520억 달러를 기록했다. 현재 오픈에이아이도 기업공개를 준비하고 있어 두 기업이 상장 경쟁을 벌이면서 인공지능 시장의 신뢰도도 시험대에 오를 전망이다. 2021년 오픈에이아이 출신 연구원들이 설립한 앤스로픽은 초기에는 주목받지 못했으나 기업용 서비스 부문에서 거둔 성과를 바탕으로 성장했다. 연간 환산 매출(revenue run-rate)은 2025년 말 90억 달러에서 최근 470억 달러로 급증했다. 새로운 인공지능 모델 미토스(Mythos)가 널리 보급되면 매출 성장세가 더욱 가팔라질 수 있다. 미토스는 보안 취약점 문제로 개발자 접근이 제한된 상태이지만, 앤스로픽은 유럽연합(European Union, EU) 사이버보안국이 먼저 미토스를 검증할 수 있도록 권한을 열어줄 계획이다.

기사원문 바로가기

 

Anthropic files to go public | TechCrunch

Anthropic, now an AI powerhouse that has landed top-tier enterprise customers, was once considered an underdog in the emerging world of large language models.

techcrunch.com

 

3. 인텔, 경쟁사 대비 저렴하고 발열 낮은 인공지능 추론 칩 ‘크레센트 아일랜드’ 출시 예정

인텔은 2026년 말까지 엔비디아와 AMD 제품보다 저렴한 메모리와 냉각 기술을 적용한 인공지능(artificial intelligence, AI) 추론(inference) 칩을 출시한다. 새로운 그래픽 처리장치(graphics processing unit, GPU) ‘크레센트 아일랜드(Crescent Island)‘는 사용자 질문에 답하는 단계를 가속하도록 설계했다. 인텔 데이터센터(data center) 그룹 담당 책임자 케보크 케치치안(Kevork Kechichian)은 과거 개발했던 학습용 반도체 흥행 실패를 겪은 뒤 기본부터 다시 시작하기로 결정했다고 밝혔다. 신형 반도체는 가격이 비싼 고대역폭 메모리(high bandwidth memory, HBM)와 수랭식 냉각 장치 대신 저전력 더블 데이터 레이트 5(low power double data rate 5, LPDDR5) 메모리와 공랭식 냉각 기술을 사용한다. 인텔은 실적 악화로 물러난 팻 겔싱어(Pat Gelsinger) 전임 대표 뒤를 이어 부임한 립부 탄(Lip-Bu Tan) 최고경영자(chief executive officer, CEO) 체제 아래에서 인공지능 기반 시설 시장을 본격적으로 공략한다. 인텔은 생산 단가를 낮추고자 대만반도체제조회사(Taiwan Semiconductor Manufacturing Company, TSMC)에 생산을 위탁하는 대신 자체 반도체 위탁생산(foundry) 공장에서 직접 칩을 제조할 계획이다. 아울러 미국 정부 수출 규제를 준수하는 범위 안에서 중국 시장에 제품을 공급하는 방안도 함께 검토한다.

기사원문 바로가기

 

Intel targets new AI data centre chip by year end

Leader of data centre unit says company aims to release ‘inference’ GPU as shares rally more than 200% this year

www.ft.com

 

4. 엔비디아 CEO 젠슨 황이 제시하는 에이전트 인공지능 시대의 5가지 미래 방향

엔비디아(Nvidia) 최고경영자 젠슨 황(Jensen Huang)은 타이베이에서 개최한 기술 행사 기조연설에서 에이전트 인공지능(agentic artificial intelligence) 시대를 선언했다. 황 최고경영자는 유용한 인공지능이 도래해 데이터 센터뿐만 아니라 세계 경제 구조와 기술 노동 시장을 바꿀 것이라고 보았다. 기트허브(GitHub) 통계에 따르면 전문 개발자 수가 정체된 상황에서도 2023년부터 2026년 초 사이에 코드를 등록한 횟수가 세 배 가까이 늘었다. 인공지능 코파일럿(AI copilot)이 개발자 생산성을 높인 결과다. 이에 따라 황 최고경영자는 인공지능이 일자리를 없앤다는 우려를 정면 반박했다. 개발자 집단이 총 삼조 달러를 급여로 받으며 구조 달러에 이르는 생산 가치를 만들 수 있다면 기업은 개발자를 더 고용할 수밖에 없다고 역설했다. 인공지능이 출력하는 기본 단위인 토큰(token)은 이제 매출을 직접 일으키는 수익 단위가 되었다. 토큰을 대량으로 생성하려는 수요가 늘어나면서 대만 내 고성능 컴퓨터 하드웨어 수요도 급증했다. 와트당 토큰 처리량이 매출을 결정하기 때문에 전력 소모를 줄이면서 연산 속도를 높이는 아키텍처(architecture)를 선택해야 한다. 에이전트 인공지능은 기존 애플리케이션을 대체하는 소프트웨어 개발 방식으로 정착하고 있다. 기존 운영체제에서 작동하는 앱과 달리, 에이전트는 대규모 언어모델(large language model, LLM) 여러 개를 제어 프로그램(harness)에 얹어 유기적으로 작동한다. 제어 프로그램은 사용자 의도와 주변 맥락(context)을 파악한 뒤 스스로 계획을 세운다. 그 후 데이터베이스나 쿠다(CUDA) 라이브러리를 비롯한 도구를 사용해 업무를 해결한다. 에이전트의 구동 단계에 맞춰 그래픽 처리장치(graphics processing unit, GPU)는 추론 연산을 담당하고 중앙처리장치(central processing unit, CPU)는 도구 실행을 처리한다. 데이터 처리장치(data processing unit, DPU)는 보안을 담당하여 데이터 센터의 모든 자원을 효율적으로 나누어 쓰도록 돕는다. 에이전트를 구동하려면 엄청난 연산 성능을 갖춘 인공지능 공장(AI factory)이 필요하다. 엔비디아는 인공지능 공장을 효율적으로 설계하고 가동할 수 있도록 돕는 전체 시스템 설계 표준인 디에스엑스(DSX)를 보급하고 있다. 이 설계 표준은 반도체와 랙, 냉각 장치를 물리적으로 설치하기 전에 가상 세계인 옴니버스(Omniverse) 환경에서 검증하여 구조적 결함을 예방한다. 엔비디아는 이 같은 통합 설계 시스템을 지원하며 단순한 반도체 제조사에서 벗어나 하드웨어와 전력 인프라까지 아우르는 인공지능 솔루션 기업으로 체질을 바꾸고 있다. 에이전트 인공지능 시스템에서 일어나는 병목 현상을 해결할 차세대 하드웨어 브랜드인 베라 루빈(Vera Rubin)과 베라 중앙처리장치(Vera CPU)도 첫선을 보였다. 베라 루빈은 단순한 단일 칩이 아니라 차세대 그래픽 처리장치, 베라 중앙처리장치, 데이터 처리장치를 고속 스위치로 묶은 대형 시스템이다. 배선 설계를 다듬어 기존 랙을 조립할 때 두 시간이 걸리던 작업을 오 분으로 단축했다. 또한 베라 중앙처리장치는 팔십팔 코어로 구성하고 넓은 대역폭을 지원해 에이전트가 데이터에 접근하는 속도를 높였다. 초 단위로 작동하던 기존 중앙처리장치와 달리 에이전트가 나노초 단위로 요청하는 작업에 즉각 반응하도록 성능을 최적화했다. 황 최고경영자는 중앙처리장치를 지휘자에, 그래픽 처리장치를 오케스트라 단원에 비유하며 두 하드웨어가 긴밀히 협력해야 고성능 에이전트를 원활하게 구동할 수 있다고 설명했다.

기사원문 바로가기

 

Five thoughts from Nvidia CEO Jensen Huang’s GTC Taipei 2026 keynote - SiliconANGLE

Five thoughts from Nvidia CEO Jensen Huang’s GTC Taipei 2026 keynote - SiliconANGLE

siliconangle.com

 

5. 오픈에이아이, 미시간주 샐린에 1기가와트급 인공지능 데이터 센터 착공

오픈에이아이(OpenAI)는 오라클(Oracle), 릴레이티드 디지털(Related Digital), 월브릿지(Walbridge), 블랙스톤(Blackstone)과 협력하여 미국 미시간주 샐린에 1기가와트(gigawatt, GW)급 데이터 센터(data center) 단지인 ‘더 바른(The Barn)‘을 착공했다. 더 바른은 인공지능(artificial intelligence, AI)을 개발하고 확장하는 데 필요한 대규모 연산 능력을 확보하고자 추진하는 스타게이트(Stargate) 프로젝트의 일환이다. 약 250에이커 규모 부지에 단층 건물 3개 동이 들어서며, 총면적은 165만 제곱피트에 달한다. 건설 과정에서 조합원 일자리 2,500개 이상이 생기며, 완공 후에는 상주 일자리 450개, 군(county) 전체 일자리 1,500개, 간접 일자리 약 1,000개가 만들어진다. 지역 주민의 전기요금 부담이 늘어나지 않도록 전력망을 구축하는 비용은 프로젝트 자체 재원으로 충당한다. 아울러 지역 전력망을 안정화하기 위해 신규 배터리 저장(battery storage) 시설을 함께 설치한다. 수자원 소모를 최소화하기 위해 내부 냉각수가 순환하는 폐쇄 루프 냉각(closed-loop cooling) 시스템을 갖춘다. 지역 사회와 상생하고자 샐린 레크리에이션 센터를 넓히고 현대화하는 데 1,000만 달러를 투입한다. 지역 학생 약 40만 명이 인공지능 기술을 배울 수 있도록 최대 4,500만 달러 규모의 코덱스(Codex) 크레딧을 제공한다. 더 바른 단지는 2027년 말까지 공사를 마무리하고 2028년 초부터 본격적으로 가동한다.

기사원문 바로가기

 

Building the infrastructure for the Intelligence Age in Michigan

OpenAI breaks ground on a 1GW data center project in Michigan as part of Stargate, building AI infrastructure to expand access, create jobs, and support communities.

openai.com

 

6. 대만 정보기술 제조 업계, 엔비디아와 협력해 인공지능 인프라 생산 및 스마트 공정 도입 가속화

대만은 엔비디아(NVIDIA) 협력사 500여 개가 모인 생산 거점이다. 현지 공장 25곳은 차세대 에이전트 인공지능(agentic AI) 공장을 가동할 베라 루빈(Vera Rubin) 인프라용 엠지엑스(MGX) 랙 부품 100만 개 이상을 조립하며 글로벌 공급망을 구축한다. 반도체 생산을 담당하는 티에스엠씨(TSMC)를 비롯하여 폭스콘(Foxconn), 페가트론(Pegatron), 위스트론(Wistron), 인벤텍(Inventec) 등 제조 대기업들이 부품 조립에 그치지 않고 자체 생산 기지에 인공지능 기술을 결합하는 추세다. 티에스엠씨는 반도체 공정에 엔비디아 가속 컴퓨팅 라이브러리인 쿠다-엑스(CUDA-X)와 인공지능 모델을 적용했다. 극자외선 노광 연산을 돕는 큐리토(cuLitho)는 생산 주기와 비용을 최대 50% 줄였고, 큐에스트(cuEST) 라이브러리는 재료 시뮬레이션 속도를 평균 50배 높였다. 큐엠엘(cuML)과 메트로폴리스(Metropolis) 및 타오 툴킷(TAO Toolkit)은 공정을 정밀하게 제어하고 불량을 분석하는 데 쓰인다. 폭스콘은 가상 공장 청사진과 네모클라우(NemoClaw) 설계안을 활용해 생산 관리 에이전트인 모브클라우(MoMClaw)를 구축했다. 모브클라우는 기계 신호를 분석해 기계 고장률을 10% 낮추고 근본 원인 분석 속도를 80% 끌어올렸다. 아울러 비디오 검색 및 요약(video search and summarization, VSS) 기술이 들어간 딥하우(DeepHow) 시스템을 도입해 수율을 3% 높였고, 바퀴 달린 인간형 로봇으로 나사 체결 작업을 자동화했다. 1만 개의 그래픽 처리장치(graphics processing unit, GPU)를 탑재한 폭스콘 인공지능 클라우드 센터는 지비300(GB300) 하이브리드 냉각 기술로 내부 열을 식힌다. 큐시티(Quanta Cloud Technology, QCT)는 옴니버스(Omniverse) 기반 디지털 트윈(digital twin)으로 가상 공장을 설계해 작업 공간 활용도를 극대화했다. 자회사 테크맨 로봇(Techman Robot)은 젯슨 토르(Jetson Thor)와 그루트(GR00T) 플랫폼을 탑재한 로봇으로 팬 조립 공정을 자동화했다. 위스트론은 피직스네모(PhysicsNeMo)와 설계 프로그램으로 고온 검사 환경을 가상 공간에 재현해 배치 분석 시간을 70% 줄이고 전력 소모도 20% 절감했다. 페가트론은 불량 이미지 가상 생성 기술을 접목해 검사 장비 배치 기간을 67% 단축하고 운영 공수를 10% 아꼈다. 인벤텍 또한 불량 이미지 생성 기술로 가상 데이터 1만 장 이상을 확보해 실제 불량 수집과 라벨링 과정을 30% 줄였으며 이상 탐지 정확도를 10% 높였다.

기사원문 바로가기

 

7. 엔비디아 투자 유치한 50억 달러 가치 인공지능 기업 런웨이, 런던 대규모 확장 발표

미국 인공지능(artificial intelligence, AI) 기업 런웨이(Runway)가 영국 런던에 새로운 유럽 본사(headquarters)를 설립하고 현지 사업을 대규모로 확장하겠다고 발표했다. 런웨이는 2028년 말까지 영국 인공지능 생태계에 2억 달러(USD) 이상을 투자할 예정이다. 런웨이는 최근 제너럴 애틀랜틱(General Atlantic), 에이엠디 벤처스(AMD Ventures), 엔비디아(Nvidia) 등이 참여한 시리즈 E(Series E) 투자에서 3억 1,500만 달러를 모으며 기업 가치 53억 달러를 인정받았다. 아나스타시스 게르마니디스(Anastasis Germanidis) 공동 창업자 겸 공동 최고경영자(co-CEO)는 런던이 비비씨(BBC), 프리맨틀(Fremantle), 더블유피피(WPP) 등 유럽 주요 고객사와 가깝고 기존 연구 팀이 활동하고 있으며 우수한 인재가 많아 첫 행선지로 적합하다고 밝혔다. 런웨이는 언어 중심 대규모 언어모델(large language model, LLM)과 다르게 오디오, 이미지, 영상 등 실제 데이터를 바탕으로 물리 세계를 이해하는 세계 모델(world model)을 연구하며 영상 생성 및 편집 도구도 선보인다. 카니시카 나라얀(Kanishka Narayan) 영국 인공지능부 장관은 런웨이가 들어서면서 영화, 게임, 과학, 로봇 공학 등 여러 산업에서 혁신이 일어날 것이라며 환영했다. 런웨이가 추진하는 런던 진출은 앞서 현지 사무소를 개소한 앤트로픽(Anthropic) 및 오픈에이아이(OpenAI)가 보여준 행보, 올여름 본사를 이전하려는 구글(Google)이 세운 계획과 맞물려 미국 인공지능 기업들이 영국 시장과 인재를 모으려는 경쟁을 보여준다.

기사원문 바로가기

 

Nvidia-backed $5 billion AI company tells CNBC of major London expansion

Runway follows U.S. AI giants including Anthropic and OpenAI in announcing big London growth plans.

www.cnbc.com

 

8. 직원용 AI 사용 제한 설정 누락으로 한 달 만에 ‘클로드’ 비용 5억 달러 지출한 기업 발생

미국 매체 엑시오스(Axios)는 인공지능(AI)을 도입한 기업들이 실질적인 효과를 거두지 못한 채 과도한 비용 문제에 직면했다고 보도했다. 한 컨설턴트에 따르면 어느 익명 기업은 직원들이 사용하는 클로드(Claude) 라이선스에 사용 한도를 설정하지 않아 한 달 만에 5억 달러를 지출했다. 최근 기업들은 직원들에게 AI 도구를 쓰라고 강요하며 토큰맥싱(tokenmaxxing)을 유도하고 있다. 메타(Meta)는 직원 고과에 AI 사용 실적을 반영한다. 아마존(Amazon)은 직원들이 AI 도구를 사용하는 실적을 담은 순위표를 운영했으나 무의미하게 작업을 지시하는 사례가 급증하자 순위표를 폐지했다. 직원들이 날씨 확인 같은 단순한 작업에 AI 모델을 쓰거나 중요도가 낮은 업무를 주로 자동화하는 행동도 불필요한 비용을 발생시킨다. 소피아 벨라스테기(Sophia Velastegui) 벨라스테기 벤처스(Velastegui Ventures) 최고경영자(CEO)는 직원들이 회사에 유익한 일보다 본인이 하기 싫어하는 업무를 자동화하는 경향이 있다고 설명했다. 일각에서는 비용이 점차 낮아질 것이라고 주장한다. 반면 AI 서비스 제공업체들은 막대한 컴퓨팅 비용을 감당하기 위해 요금을 올리거나 사용량을 제한하는 추세다. 마이크로소프트(Microsoft)는 지난달 인기가 높았던 개발자용 인공지능 에이전트(AI agent)인 클로드 코드(Claude Code) 라이선스를 취소하기 시작했다.

기사원문 바로가기

 

9. 엔비디아가 글로벌 인공지능 연산 수요에 대응하고자 전 세계 AI 클라우드 생태계를 확장한다

엔비디아(NVIDIA)가 글로벌 인공지능(artificial intelligence, AI) 연산 수요가 급증함에 따라 전 세계 AI 클라우드(cloud) 생태계를 확장한다. AI 클라우드 협력사들은 기업, 신생 벤처기업(startup), 국가, 인공지능 연구소가 요구하는 연산 능력을 지원하고자 설비 용량을 늘리고 있다. 엔비디아 인공지능 클라우드는 가속 컴퓨팅(accelerated computing), 네트워킹(networking), AI 소프트웨어(software)를 결합하여 모델 학습과 미세조정(fine-tuning) 및 추론(inference)을 지원한다. 엔비디아 창립자이자 최고경영자(chief executive officer, CEO)인 젠슨 황(Jensen Huang)은 모든 기업과 국가가 데이터를 지능으로 전환할 AI 공장 인프라(infrastructure)가 필요하다고 강조했다. 인공지능 클라우드 생태계는 아프리카 카사바(Cassava)와 남미 클라로(Claro)가 합류하면서 6개 대륙으로 넓어졌다. 퍼머스 테크놀로지(Firmus Technologies)는 호주와 동남아시아에서 재생에너지(renewable power)와 액체 냉각(liquid cooling) 기술을 적용해 모듈형(modular) AI 공장을 세우고 있다. 퍼머스는 에스티 텔레미디아 글로벌 데이터 센터(ST Telemedia Global Data Centres)와 협력하여 싱가포르에도 AI 인프라를 배치했다. 코어위브(CoreWeave)는 차세대 반도체인 베라 루빈(Vera Rubin)과 베라 중앙처리장치(Vera central processing unit, Vera CPU)를 들여와 설비를 넓히고 있다. 코어위브는 그래픽 처리장치(graphics processing unit, GPU) 수백만 개를 연결하는 스펙트럼-X 이더넷 포토닉스(Spectrum-X Ethernet Photonics) 네트워킹 기술을 갖췄다. 물리적 AI(physical AI) 분야에서는 월드 모델(world foundation model) 코스모스 3(Cosmos 3)가 쓰인다. 코스모스 3는 가상 데이터를 제작하고 로봇 개발을 앞당기는 역할을 맡는다. 네비우스(Nebius)도 베라 루빈을 들여왔으며 물리적 AI 벤치(Physical AI Workbench)를 선보였다. 물리적 AI 벤치는 코스모스 3와 아이작 심(Isaac Sim), 아이작 그루트(Isaac GR00T)를 결합해 에이전트 AI가 복잡한 작업을 바로 처리하도록 지원한다. 코어위브, 크루소(Crusoe), 람다(Lambda), 네비우스, 벌처(Vultr), 와이티엘(YTL) 등 협력사 6곳이 모범 클라우드(Exemplar Cloud) 자격을 얻었다. 엔비디아는 연산, 네트워킹, 메모리, 저장 장치를 포함한 전체 스택을 연계해 설계함으로써 토큰당 처리 비용을 낮췄다. AI 클라우드 협력사들은 공장을 구축하고 운영하고자 엔비디아 디에스엑스(DSX) 플랫폼을 적용한다. 디에스엑스 심(DSX Sim)은 설치 전에 공장 모형을 검증하며, 디에스엑스 플렉스(DSX Flex)는 전력망 상태에 맞춰 연산 작업을 유연하게 조율한다. 디에스엑스 맥스엘피에스(DSX MaxLPS)는 제한된 전력 안에서 연산 성능을 최대화해 그래픽 처리장치 수량을 최대 40% 늘리도록 돕는다. 디에스엑스 오에스(DSX OS)는 수명 주기 관리와 운영 작업을 자동화한다.

기사원문 바로가기

 

NVIDIA AI Cloud Ecosystem Expands Worldwide to Meet Global AI Compute Demand

Fast-growing ecosystem helps enterprises, startups, nations, AI labs and developers scale agentic AI applications.

blogs.nvidia.com

 

10. 오픈AI 최신 프론티어 모델 및 코덱스 아마존웹서비스 배드락 출시

오픈AI(OpenAI)가 최신 프론티어 모델(frontier model)인 지피티-5.5(GPT-5.5)와 지피티-5.4(GPT-5.4), 코덱스(Codex) 코딩 에이전트를 아마존웹서비스(Amazon Web Services, AWS) 배드락(Bedrock) 서비스에 출시했다. 양사가 마이크로소프트(Microsoft) 독점 체제였던 기존 파트너십 계약을 개정하면서 아마존웹서비스도 최신 모델을 제공하기 시작했다. 기업 고객은 별도 계약 없이 기존 약정된 아마존웹서비스 클라우드 잔여 사용량에서 오픈AI 모델 사용 비용을 차감한다. 아울러 기존 보안 체계, 거버넌스(governance), 통합 인증 수단을 포함한 클라우드 인프라를 그대로 이용해 인공지능(artificial intelligence, AI) 모델을 구축한다. 코덱스는 소프트웨어 코드 생성과 디버깅(debugging)을 지원하며 다양한 통합 개발 환경(integrated development environment, IDE)과 연동한다. 고객이 지정한 리전(region) 내부에서만 데이터를 다루므로 데이터 주권 요구 사항을 충족한다. 양사는 서비스 이용 요금을 오픈AI가 직접 청구하는 가격과 동일하게 책정했다. 앞으로 양사는 사이버 보안 모델과 코드 검토 도구를 포함한 소프트웨어 방어 이니셔티브(initiative)인 데이브레이크(Daybreak)를 통합하며 협력을 넓혀 갈 방침이다.

기사원문 바로가기

 

OpenAI frontier models and Codex are now available on AWS

OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new path to build with OpenAI through the AWS environments, controls, and procurement workflows they already use. Customers can get started with OpenAI on AWS and mov

openai.com

 

🚀 AI 제품·서비스 (19건)

1. 중국 인공지능(artificial intelligence, AI) 스타트업 미니맥스(MiniMax), 고성능·저비용 모델 ‘M3’ 공개

중국 인공지능 스타트업 미니맥스가 미국 상용 모델의 5\~10% 수준 가격으로 동작하는 대규모 언어모델(large language model, LLM) ‘M3’를 공개했다. M3는 코딩(coding)과 에이전트(agent) 영역에서 뛰어난 성능을 보인다. 맥락 창(context window) 크기는 100만 토큰(token)에 이르며 시청각 자료를 분석하는 멀티모달(multimodality) 기능도 지원한다. 미니맥스는 기업이 모델을 직접 내려받아 쓰도록 가중치(weights)를 10일 이내에 배포할 계획이다. 구독 요금제는 월 20달러부터 시작하며, 현재 응용 프로그램 인터페이스(application programming interface, API) 사용 요금은 100만 입력 토큰당 0.3달러, 출력 토큰당 1.2달러로 책정되었다. 미니맥스는 기존 트랜스포머(transformer) 구조 대신 키-값(key-value, KV) 행렬을 나눠 연산하는 미니맥스 희소 어텐션(MiniMax Sparse Attention, MSA) 기술로 구동 비용을 낮췄다. MSA는 연속 메모리 접근 방식을 적용해 하드웨어(hardware) 사용 효율을 극대화한다. 내부 테스트에서는 경쟁 관계인 오픈소스(open source) 소프트웨어(software)보다 4배 이상 빠른 속도를 기록했다.

기사원문 바로가기

 

MiniMax M3 debuts, eclipsing GPT-5.5 and Gemini 3.1 Pro on key benchmark performance for just 5-10% of the cost

M3 demonstrates that the next phase of agent development will not just be driven by larger datasets, but by efficient architectural choices.

venturebeat.com

 

2. 핑거프린트, 챗GPT·제미나이·클로드 등 인공지능 비서 트래픽 식별 솔루션 출시

기기 지능(device intelligence) 전문 기업 핑거프린트(FingerprintJS Inc.)가 챗GPT(ChatGPT), 제미나이(Gemini), 클로드(Claude) 등 주요 인공지능(artificial intelligence, AI) 비서 트래픽을 식별하고 검증하는 두 제품의 미리보기(preview) 버전을 출시했다. 브라우저 없이 발생하는 인공지능 비서 요청은 브라우저 신호 전송과 자바스크립트(JavaScript) 실행 과정을 생략하므로 기존 보안 기술로 탐지하기 어렵다. 새로 개발한 인공지능 비서 탐지(AI Assistant Detection) 기술은 콘텐츠 전송 네트워크(content delivery network, CDN) 에지(edge)나 미들웨어(middleware) 단계인 에이치티티피(Hypertext Transfer Protocol, HTTP) 수준에서 트래픽을 식별한다. 핑거프린트는 아이피(Internet Protocol, IP) 대역 조회와 도메인 네임 시스템(Domain Name System, DNS) 검증을 거쳐 유입된 요청의 진위 여부를 판별한다. 자동화 인텔리전스 응용 프로그램 프로그래밍 인터페이스(Automation Intelligence Application Programming Interface, API)는 플랫폼에 관계없이 에지 단에서 실시간 트래픽을 식별하고 프록시(proxy)나 가상 사설망(virtual private network, VPN), 토어(Tor) 같은 네트워크 위험 요소를 분류한다. 기존에 출시한 승인된 인공지능 에이전트 탐지(Authorized AI Agent Detection) 도구와 신기술을 결합하여, 작업 수행 목적의 에이전트와 정보 수집 목적의 비서 트래픽을 모두 아우르는 통합 식별 계층(identification layer)을 구축했다. 기업은 모든 자동화 트래픽을 일괄 차단하는 대신 검증된 인공지능 비서 접근만 허용하여 답변 엔진 최적화(Answer Engine Optimization, AEO)에 대비하고, 인공지능 비서 신원을 위장한 무단 웹 스크래퍼(web scraper)나 악성 봇(malicious bot)은 걸러낼 수 있다.

기사원문 바로가기

 

Fingerprint launches AI Assistant Detection to spot traffic from ChatGPT, Gemini and Claude - SiliconANGLE

Fingerprint launches AI Assistant Detection to spot traffic from ChatGPT, Gemini and Claude - SiliconANGLE

siliconangle.com

 

3. “AI 요금 충격” 깃허브 코파일럿 사용량 기반 요금제 도입에 이용자 반발

깃허브(GitHub)가 인공지능(artificial intelligence, AI) 기반 코딩 보조 도구인 코파일럿(Copilot)의 요금제를 기존 요청 횟수 기준에서 사용량 기반 요금제(usage-based pricing system)로 변경했다. 2026년 6월 1일 새로운 요금 정책이 적용되며 많은 이용자가 비용 충격을 겪고 있다. 이용자들은 일상적인 코딩 작업 중에 한 달 치 제공량인 크레딧(credit)을 단 하루 만에 모두 소모했다며 소셜 미디어와 온라인 커뮤니티에 불만을 제기했다. 기존 방식은 간단한 질문과 긴 자율 코딩의 청구 비용이 같아 깃허브가 인프라 비용을 전적으로 부담했다. 이용자들이 자체 사용량 추정 도구로 확인한 결과 이전의 사용 패턴을 유지하면 매달 수천 달러의 청구서가 발생하는 것으로 나타났다. 새로 도입된 요금제는 1크레딧을 0.01달러로 산정해 매달 구독 등급에 따라 크레딧을 차등 지급한다. 월 10달러 구독 요금인 프로(Pro) 등급은 1,500크레딧을 제공하고, 월 100달러인 코파일럿 맥스(Copilot Max) 등급은 20,000크레딧을 제공한다. 크레딧 소모량은 이용자가 선택한 대규모 언어모델(large language model, LLM)의 종류와 입력 및 출력 토큰(token) 수에 따라 결정된다. 일례로 코파일럿에서 오픈에이아이(OpenAI)의 지피티(Generative Pre-trained Transformer, GPT)-5.4 나노 모델을 사용하면 출력 토큰 100만 개당 1.25달러가 소모되지만, 최고급 모델인 지피티-5.5를 선택하면 30달러가 소모된다. 일부 이용자는 가장 저렴한 모델로 코딩 계획을 세우는 간단한 작업에도 100크레딧을 소비했다며 요금 수준에 불만을 표시했다. 크레딧을 절약하려는 이용자들은 긴 대화 이력을 유지하는 대신 대화를 자주 새로 시작해 입력 토큰 누적을 피하는 방법으로 대응하고 있다. 가격 부담 때문에 구독 취소를 예고하고 더 저렴한 딥시크(Deepseek) 모델을 개발 환경에 직접 연동해 대안으로 사용하는 사례도 늘고 있다. 시장에서는 이번 요금 개편이 업계 전체로 확산될 수 있으며 토큰 효율성이 우수한 언어 모델이 경쟁력을 얻을 것으로 예측하고 있다.

기사원문 바로가기

 

AI costs how much? GitHub Copilot users react to new usage-based pricing system.

Some report burning through their whole monthly "AI credit" allotment in a single day.

arstechnica.com

 

4. 엔비디아, 중국 유니트리와 손잡고 연구·개발용 휴머노이드 로봇 플랫폼 구축

엔비디아(NVIDIA)는 컴퓨텍스(Computex) 2026에서 휴머노이드(humanoid) 로봇 연구 개발을 앞당기려고 중국 유니트리 로보틱스(Unitree Robotics), 싱가포르 샤파(Sharpa)와 손을 잡았다. 엔비디아는 하드웨어와 인공지능(artificial intelligence, AI) 소프트웨어를 결합한 개발자 청사진을 제시했다. 로봇 몸체는 유니트리 로보틱스가 개발한 키 약 1.8미터, 무게 약 68킬로그램 크기인 ‘H2 플러스(H2 Plus)’ 로봇 뼈대를 기반으로 삼는다. 로봇 손은 샤파가 제작한 촉각(tactile) 센서를 탑재한 다섯 손가락 로봇 손 ‘웨이브(Wave)‘를 장착해 물건을 정교하게 조작한다. 로봇 두뇌는 엔비디아 블랙웰(Blackwell) 그래픽 처리장치(graphics processing unit, GPU) 아키텍처를 적용한 시스템온칩(system on chip, SoC) ‘젯슨 토르(Jetson Thor)‘가 실시간 인공지능 연산을 처리한다. 소프트웨어는 오픈소스 소프트웨어 스택인 엔비디아 아이작 그루트(Isaac GR00T)와 시뮬레이션(simulation) 도구인 아이작 심(Isaac Sim) 및 아이작 랩(Isaac Lab)으로 로봇을 훈련하고 검증한다. 파편화한 개발 환경을 통합해 연구진이 기초 기술을 처음부터 직접 만들지 않고도 로봇 작동과 기능 연구에 속도를 내게끔 돕는다. 앨런 인공지능 연구소(Allen Institute for AI), 취리히 연방 공과대학교(ETH Zurich), 스탠퍼드 로보틱스 센터(Stanford Robotics Center), 캘리포니아 대학교 샌디에이고(University of California, San Diego) 등 주요 연구 기관이 새 플랫폼을 연구에 쓸 계획이다. 유니트리 로보틱스가 선보이는 H2 플러스 레퍼런스 디자인은 2026년 말 출시될 예정이며, 엔비디아 아이작 그루트 플랫폼은 유니트리 로보틱스가 기존에 출시한 소형 휴머노이드 로봇 ‘G1’도 지원한다. 엔비디아는 미국, 유럽, 한국에 있는 로봇 제조사들과도 협력해 로봇 생태계를 넓혀갈 계획이다.

기사원문 바로가기

 

Nvidia Taps Unitree for Humanoid Robot Platform

Nvidia Taps Unitree for Humanoid Robot Platform

aibusiness.com

 

5. 엔비디아, 윈도우 노트북 및 소형 데스크톱용 AI 프로세서 ‘RTX 스파크’ 공개

엔비디아(Nvidia)는 윈도우(Windows) 노트북과 소형 데스크톱을 지원하는 시스템온칩(system-on-chip, SoC) ‘RTX 스파크(RTX Spark)‘를 공개했다. RTX 스파크는 인공지능 에이전트(artificial intelligence agent) 작동을 개선하는 윈도우 운영체제 개선과 연계해 출시된다. 엔비디아는 이와 별도로 기술 전문가용 인공지능 최적화 데스크톱도 함께 선보인다. RTX 스파크는 미디어텍(MediaTek)과 협력해 개발한 20코어 그레이스(Grace) 중앙 처리 장치(central processing unit, CPU)를 내장했다. 여기에 6,144개 쿠다(CUDA) 코어와 인공지능 연산용 텐서(Tensor) 코어를 갖춘 블랙웰(Blackwell) 아키텍처 기반 그래픽 처리 장치(graphics processing unit, GPU)를 결합했다. 두 장치는 엔브이링크-C2C(NVLink-C2C) 기술로 이어져 데이터를 주고받는다. RTX 스파크는 최대 128기가바이트 통합 메모리(unified memory)를 지원하며 부동소수점4(FP4) 형식에서 최대 1페타플롭(petaflop)에 달하는 성능을 낸다. 기기 내부에서는 최대 1,200억 개 매개변수를 지닌 대규모 언어 모델(large language model, LLM)과 100만 토큰에 달하는 문맥 창을 직접 구동한다. 사용자는 12K 해상도 동영상 편집이나 대규모 3차원 화면 구현 같은 작업을 막힘없이 다룬다. 초당 100프레임이 넘는 1440p 해상도 고사양 게임도 매끄럽게 구동한다. 제조사들은 두께가 얇은 노트북에서도 배터리를 온종일 쓸 수 있게 설계했다. RTX 스파크를 장착한 기기는 2026년 가을부터 시장에 나온다. 에이수스(ASUS), 델(Dell), 에이치피(HP), 레노버(Lenovo), 마이크로소프트(Microsoft) 서피스, 엠에스아이(MSI)가 초기 협력사로 참여하며 에이서(Acer)와 기가바이트(GIGABYTE)도 동참한다. 새 칩은 윈도우용 인공지능 에이전트 앱인 오픈클로(OpenClaw) 제어 기능과 연동되어 개인화 서비스를 돕는다.

기사원문 바로가기

 

Nvidia debuts RTX Spark processor for Windows laptops, compact desktops - SiliconANGLE

Nvidia debuts RTX Spark processor for Windows laptops, compact desktops - SiliconANGLE

siliconangle.com

 

6. 머지 API, 기업 내 인공지능 에이전트 통제용 보안 플랫폼 출시

기업 데이터와 도구를 잇는 인터페이스를 공급하는 머지 API(Merge API Inc.)가 기업 내부에서 인공지능(artificial intelligence, AI) 에이전트를 잘못 사용하는 사고를 막고 제어하는 보안 프로그램인 에이전트 핸들러 포 엠플로이(Agent Handler for Employees)를 출시했다. 정보기술(information technology, IT) 부서는 옥타(Okta)나 애저 AD(Azure AD) 같은 신원 제공업체(identity provider)와 연결하여 직원의 소속 부서나 직급에 맞춰 허가된 인공지능 도구와 실행 권한을 다르게 지정할 수 있다. 아울러 세션 안에서 데이터가 오가는 흐름을 감시하는 데이터 손실 방지(data loss prevention, DLP) 기능과 모든 활동을 실시간으로 기록하는 세션 로깅(session logging) 기술도 함께 제공한다. 머지 API 공동 창업자이자 최고기술책임자(chief technology officer, CTO)인 길 페이그(Gil Feig)는 승인받지 않은 외부 모델을 임의로 불러와 쓰면서 일어나는 그림자 인공지능(shadow AI) 위험을 방지하고 규제를 까다롭게 적용받는 금융, 의료, 공공 기관이 보안 우려 없이 업무용 인공지능 에이전트를 안전하게 쓰도록 이끌고자 개발을 시작했다고 설명했다.

기사원문 바로가기

 

Merge launches Agent Handler for Employees as an IT gatekeeper for workplace AI agents - SiliconANGLE

Merge launches Agent Handler for Employees as an IT gatekeeper for workplace AI agents - SiliconANGLE

siliconangle.com

 

7. 엔비디아, 보안성과 확장성 갖춘 자율형 인공지능 에이전트 개발 도구 대거 공개

엔비디아(Nvidia)가 컴퓨텍스(Computex) 전시회 기간에 타이베이에서 개최한 기술 콘퍼런스에서 기업이 자율형 인공지능(artificial intelligence, AI) 에이전트를 원활하게 개발하고 도입하도록 돕는 에이전트 툴킷(Agent Toolkit) 최신 버전을 발표했다. 대규모 언어모델(large language model, LLM)은 번역이나 이미지 제작 등에 뛰어났으나, 다중 에이전트 협업이나 수일에 걸친 세션 관리처럼 복잡한 업무를 장시간 지속할 때 한계를 드러냈다. 또한 에이전트가 민감한 정보를 조회하고 코드를 마음대로 변경하면서 대두되는 보안 위협은 기업들이 솔루션을 적용하는 데 장애물로 작용했다. 엔비디아는 이 문제를 극복하고자 에이전트 오케스트레이션(orchestration)을 구성하는 네모클로(NemoClaw) 프레임워크를 공개했다. 네모클로는 에이전트 작동 계획 수립과 행동 위임 방식을 템플릿 형태로 제공한다. 에이전트 가동 엔진 역할을 하는 네모트론 3 울트라(Nemotron 3 Ultra)는 5500억 개의 매개변수를 지닌 혼합 전문가(mixture of experts, MoE) 모델로, 복잡한 연산을 장시간 처리할 수 있다. 기존 제품보다 추론 속도는 5배 빠르고 구동 비용은 30% 저렴해 효율성이 높다. 마이크로소프트(Microsoft), 캐노니컬(Canonical), 레드햇(Red Hat)과 협력해 만든 오픈셸 보안 런타임(OpenShell Secure Runtime)은 에이전트 작동을 제어하는 보안 환경을 구축한다. 이 런타임은 민감한 정보를 가리거나 고도로 보안이 필요한 작업을 외부 서버가 아닌 로컬 기기 내에서만 처리하도록 제한한다. 또한 추가 훈련을 거치지 않고 즉각 이식할 수 있는 쿠다엑스(CUDA-X) 기반 에이전트 스킬(Agent Skills) 라이브러리를 지원한다. 대량 데이터 처리에 특화된 씨유디에프(cuDF), 물류 및 배차 경로 최적화를 돕는 씨유옵트(cuOpt), 연구 작업용 평가 도구인 에이아이큐(AI-Q), 물리 시뮬레이션용 피직스네모(PhysicsNeMo), 양자 프로그램 제작에 쓰이는 쿠다큐(CUDA-Q)가 대표적이다. 케이던스 디자인 시스템즈(Cadence Design Systems)는 반도체 설계를 검증하는 칩스택(ChipStack) 에이전트에 보안 환경을 결합했고, 지멘스(Siemens)와 크라우드스트라이크(CrowdStrike), 팔란티어 테크놀로지스(Palantir Technologies) 등도 이 툴킷으로 에이전트 시스템을 마련했다. 네모클로는 즉시 개발자에게 개방되었고, 네모트론 3 울트라는 6월 4일부터 엔비디아 님(Nvidia NIM) 마이크로서비스 형태로 제공된다.

기사원문 바로가기

 

Nvidia gives developers the tools to build secure, autonomous AI workers that scale - SiliconANGLE

Nvidia gives developers the tools to build secure, autonomous AI workers that scale - SiliconANGLE

siliconangle.com

 

8. 엔비디아, 차세대 인공지능 공장 핵심 ‘베라 루빈’ 플랫폼 생산 준비 착수

엔비디아(Nvidia)는 대만 타이베이에서 열린 컴퓨텍스(Computex)에서 차세대 인공지능(artificial intelligence, AI) 공장용 베라 루빈(Vera Rubin) 플랫폼 생산 준비에 착수했다고 발표했다. 지난 3월 개발자 대회에서 처음 공개된 베라 루빈은 단순한 그래픽처리장치(graphics processing unit, GPU) 성능 개선 제품이 아니며, 독자적으로 추론하고 외부 도구를 사용하는 에이전트 인공지능(agentic AI)을 구현하도록 아키텍처를 전면 개편한 플랫폼이다. 엔비디아는 베라 루빈 플랫폼에 루빈 GPU, 베라 중앙처리장치(central processing unit, CPU), 블루필드-4(BlueField-4) 데이터처리장치(data processing unit, DPU), 엔비디아 그록 3(Nvidia Groq 3) 언어처리장치(language processing unit, LPU) 등을 통합하여 에이전트 인공지능 처리 능력을 기존 그레이스 블랙웰(Grace Blackwell) 플랫폼보다 10배 끌어올렸다. 베라 루빈 NVL72(Vera Rubin NVL72)는 액체 냉각 방식을 사용하는 핵심 장비로, 루빈 GPU 72개와 베라 CPU 36개를 초고속 엔비링크 6(NVLink 6) 스위치로 연결하여 작동 효율을 높였다. 베라 루빈 NVL72 플랫폼을 도입하면 기존 블랙웰 칩보다 GPU 수량을 4분의 1만 사용하여 대규모 혼합 전문가(mixture-of-experts, MoE) 모델을 훈련할 수. 또한 추론 과정에서는 토큰당 처리 비용을 10분의 1로 줄이면서 처리량을 10배 늘린다. 네트워크 영역에는 광학 기술 기반 엔비디아 스펙트럼-X 이더넷 포토닉스(Nvidia Spectrum-X Ethernet Photonics) 스위치를 도입해 전력 효율을 5배 높이고 네트워크 구축 속도를 1.3배 단축했다. 플랫폼에 탑재한 블루필드-4 STX(BlueField-4 STX) 저장 장치는 인공지능 에이전트가 대화 맥락을 장기간 안정적으로 유지하도록 돕는 전용 맥락 메모리(context memory) 역할을 담당한다. 캐시 데이터를 분담 처리하므로 추론 처리량이 최대 5배 늘어난다. 시스템 보안을 높이기 위해 하드웨어에서 데이터를 직접 암호화하는 기밀 컴퓨팅(confidential computing) 기능을 적용했으며, 엔비디아 도카(Nvidia DOCA) 기술을 통해 실리콘 수준에서 보안 정책을 강제하고 제어하도록 설계했다. 에이전트 업무 전용으로 개발한 베라 CPU에는 자체 설계한 올림푸스(Olympus) 코어 88개가 들어가 파이썬(Python) 실행이나 코드 컴파일 같은 작업 시 병목 현상이 크게 줄어든다. 엔비디아는 설계부터 운영까지 통합 지원하는 엔비디아 DSX(Nvidia DSX) 설계 청사진을 제공하며, 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 슈퍼마이크로 컴퓨터(SuperMicro Computer), 레노버 그룹(Lenovo Group) 등 350여 개 협력사와 함께 올가을부터 완제품을 시장에 공급할 계획이다.

기사원문 바로가기

 

Nvidia ramps up production of Vera Rubin, the foundation of the next generation of AI factories - SiliconANGLE

Nvidia ramps up production of Vera Rubin, the foundation of the next generation of AI factories - SiliconANGLE

siliconangle.com

 

9. 인텔, 에지(edge)용 인공지능 칩 도입 사례 130건 확보 및 새로운 로봇 소프트웨어 프레임워크 공개

인텔(Intel)이 에지 인공지능(edge artificial intelligence, edge AI) 및 에지 컴퓨팅(edge computing) 설계를 위한 시리즈 3(Series 3) 프로세서 제품군의 도입 사례를 130건 이상 확보하고, 로봇공학 모델의 실험실 연구와 공장 현장 배포 간의 간극을 해소하는 오픈소스 프레임워크 오픈비노 피지컬 AI(OpenVINO Physical AI)를 공개했다. 대만 타이베이(Taipei)에서 열리는 컴퓨텍스(Computex)를 앞두고 발표된 하드웨어 및 소프트웨어 제품군은 기존 로봇 설계에서 사용하던 중앙처리장치(central processing unit, CPU)와 개별 가속기(discrete accelerator)의 복잡한 조합을 단일 시스템온칩(system-on-chip, SoC)으로 대체하는 대안을 제시한다. 인텔 18A 공정으로 제작되어 올해 1월 소비자가전전시회(Consumer Electronics Show, CES)에서 처음 공개된 시리즈 3 제품군은 인텔 코어 울트라 시리즈 3 및 인텔 코어 시리즈 3 프로세서를 포함한다. 도입 사례 중 대표적인 예시인 센서리AI(SensoryAI)는 다중 에이전트 소매점 로봇 엘라(Ella)의 구동 장치를 인텔 아키텍처로 이전했다. 기존 엘라는 별도의 중앙처리장치와 개별 가속기를 함께 사용했으나, 실시간 제어와 인공지능 추론을 모두 처리하는 단일 인텔 코어 울트라 시리즈 3 플랫폼으로 전환했다. 단일 칩 위에서 고객 대화를 담당하는 아바타(Avatar) 에이전트, 시스템 운영을 감독하는 가디언(Guardian) 에이전트, 매장 비즈니스 인텔리전스를 제공하는 엘라 에이전트가 동시에 실행되며, 결정론적 오케스트레이터가 로봇 명령을 제어한다. 시리즈 3 프로세서는 산업용 생성형 인공지능, 비전 결함 검사, 견고한 차량용 컴퓨터, 범용 인간형 로봇(humanoid), 의료 영상용 멀티모달(multimodal) 인공지능 등의 설계에도 다양하게 도입된다. 오픈비노 피지컬 AI는 인텔이 2018년 에지 컴퓨터 비전용으로 출시한 오픈비노 툴킷(OpenVINO toolkit)을 확장한 프레임워크로, 반도체에 최적화된 추론 런타임을 내장한 로봇공학 라이브러리다. 개발자는 다양한 로봇에 적용 가능한 인공지능 제어 정책과 멀티모달 모델을 일관된 방식으로 구축하고 추론 성능을 향상시킬 수 있다. 오픈비노 피지컬 AI는 인텔의 피지컬 AI 스튜디오(Physical AI Studio) 및 오픈소스 르로봇(LeRobot) 프로젝트와도 통합된다. 인텔은 자사 코어 울트라 X7 358H 프로세서가 엔비디아(Nvidia)의 젯슨 AGX 오린(Jetson AGX Orin) 및 젯슨 토르 T5000(Jetson Thor T5000) 모듈과 비교해 지연 시간(latency) 및 비용 효율성에서 우위를 보였다고 주장했다. 피지컬 AI 스튜디오는 현재 즉시 사용 가능하며, 오픈비노 피지컬 AI는 깃허브(GitHub)에 미리보기 버전으로 공개된 후 올해 하반기 정식 출시될 예정이다.

기사원문 바로가기

 

Intel touts 130-plus edge design wins for Series 3 and launches OpenVINO Physical AI framework - SiliconANGLE

Intel touts 130-plus edge design wins for Series 3 and launches OpenVINO Physical AI framework - SiliconANGLE

siliconangle.com

 

10. 엔비디아(NVIDIA), RTX PC 및 DGX 스파크(DGX Spark) 기반 로컬 인공지능(artificial intelligence, AI) 에이전트 성능 강화

엔비디아(NVIDIA)가 타이베이에서 열린 컴퓨터 엔지니어링 전시회 컴퓨텍스(COMPUTEX) 2026에서 윈도우(Windows) 환경에서 작동하는 개인용 에이전트(personal agent) 구동 성능을 높이는 새로운 하드웨어와 소프트웨어 생태계 확장 계획을 발표했다. 핵심 발표 주제는 로컬 기기 내부에서 인공지능 에이전트를 안전하게 구동하는 암(Arm) 기반 슈퍼칩(superchip) RTX 스파크(RTX Spark)와 개발자 전용 데스크사이드 슈퍼컴퓨터 윈도우용 DGX 스테이션(DGX Station for Windows) 출시 소식이다. RTX 스파크는 블랙웰(Blackwell) 아키텍처 기반 그래픽 처리 장치(graphics processing unit, GPU)와 그레이스(Grace) 중앙 처리 장치(central processing unit, CPU)를 통합하여 연산 성능 1페타플롭과 통합 메모리(unified memory) 128기가바이트(GB)를 제공한다. 사용자는 최대 1200억 개 매개변수(parameter)를 갖춘 대규모 언어모델(large language model, LLM)을 인터넷 연결 없이 로컬 기기에서 실행할 수 있다. 엔비디아는 마이크로소프트(Microsoft)와 협력해 개인 정보 보호와 작업 제어 기능을 갖춘 보안 런타임(runtime) 오픈쉘(OpenShell)을 윈도우 운영체제에 탑재했다. 깃허브(GitHub) 오픈클로(OpenClaw)와 헤르메스(Hermes) 같은 오픈소스(open source) 에이전트 개발팀도 오픈쉘을 연동하여 로컬 환경에서 구동하는 보안용 응용 프로그램을 만들고 있다. 어도비(Adobe)와 블렌더(Blender)도 작업 속도를 개선하는 동시에 레이 트레이싱(ray tracing) 기술을 적용해 엔비디아 신규 플랫폼을 지원한다. 에이수스(ASUS), 델(Dell), 레노버(Lenovo) 등 제조사가 제작한 컴퓨터 기기는 올해 가을부터 출시될 예정이다.

기사원문 바로가기

 

NVIDIA Levels Up Local AI Agents Across RTX PCs and DGX Spark

Announced at GTC Taipei at COMPUTEX, NVIDIA OpenShell brings secure agents to Windows with 2x inference performance on llama.cpp — plus, Adobe rebuilds its apps with performance and memory enhancements, and Blender adds NVIDIA DLSS 4.5 Ray Reconstruction

blogs.nvidia.com

 

11. 앤트로픽, 병렬 에이전트 조율하는 클로드 코드용 동적 워크플로 기능 출시

앤트로픽(Anthropic)은 단일 워크플로(workflow)에서 수많은 인공지능 에이전트(artificial intelligence agent)를 조율해 복잡한 소프트웨어 공학(software engineering) 업무를 해결하는 새로운 기능인 동적 워크플로(dynamic workflow)를 클로드 코드(Claude Code)에 추가했다. 클로드 코드는 동적 워크플로를 통해 스스로 조율 스크립트(orchestration script)를 생성하고 대형 작업을 여러 하위 작업(subtask)으로 쪼갠 뒤 병렬로 처리한다. 더불어 최종 결과물을 출력하기 전에 수행한 하위 작업 결과를 직접 검증해 신뢰성을 확보한다.

기사원문 바로가기

 

Claude Code Adds Dynamic Workflows for Parallel Agent Coordination

Anthropic introduced Dynamic Workflows, a new capability for Claude Code designed to handle complex software engineering tasks by coordinating large numbers of AI agents within a single workflow. The feature allows Claude to dynamically create orchestratio

www.infoq.com

 

12. 미국 파운데이션 퓨처 인더스트리스, 우크라이나 전장에서 인공지능 인간형 로봇 실전 시험 운용

미국 샌프란시스코에 본사를 둔 인공지능 기반 인간형 로봇(humanoid robot) 개발 기업 파운데이션 퓨처 인더스트리스(Foundation Future Industries)가 우크라이나 전쟁 지역에 제품을 배치해 성능을 시험했다. 2026년 2월 인간형 로봇 팬텀 마크원(Phantom Mk1) 두 대를 우크라이나 전선으로 보내 시험적으로 운용했다. 팬텀 마크원은 위험한 전선 지역에서 군인 대신 탄약과 물자를 수송해 인명 피해를 줄인다. 키 약 1.8미터, 무게 약 80킬로그램으로 29자유도를 지녔으며, 유압식 힘과 전기식 효율을 결합한 독자적인 사이클로이드 작동기(cycloid actuator)를 갖추었다. 전선에서 시험 운용하는 과정에서 몇 가지 기술적 한계가 드러났다. 방수가 되지 않아 적재 용량이 약 20킬로그램에 그쳤고, 배터리 수명이 짧아 오랜 시간 움직이기 어려운 한계를 보였다. 단점을 보완하기 위해 적재 용량을 두 배로 늘리고 성능을 높인 팬텀 투(Phantom 2)를 개발하여 2026년 말 우크라이나에 추가 배치할 계획이다. 산카엣 파탁(Sankaet Pathak) 최고경영자(chief executive officer, CEO)는 18개월 안에 연간 수천 대를 생산할 체계를 구축하고, 미군과 협력해 전장 평가를 치르겠다는 목표를 제시했다. 파운데이션 퓨처 인더스트리스는 미국 육·해·공군으로부터 장비 검사와 물류, 무기 관리 분야의 연구 개발 목적으로 총 2,400만 달러 규모의 계약을 맺었다. 도널드 트럼프(Donald Trump) 전 미국 대통령의 아들인 에릭 트럼프(Eric Trump)가 투자자이자 최고 전략 고문으로 합류하면서 업계와 정치권의 관심이 쏠렸다. 파탁 최고경영자는 가정용 가사 보조보다 위험한 군사 업무에 로봇을 먼저 투입하는 편이 도덕적 의무에 부합한다고 주장했다. 다만 로봇을 무장할 경우 최종 결정권은 항상 사람에게 남겨두어야 한다고 밝혔다.

기사원문 바로가기

 

US Humanoid Robots Being Tested in Ukraine War

US Humanoid Robots Being Tested in Ukraine War

aibusiness.com

 

13. 마이텔 CX, 통신 분야의 소버린 클라우드 문제 해결

고객 서비스 분야에서 인공지능(artificial intelligence, AI)을 도입하기 시작하면서 통신 인프라에서도 소버린 클라우드(sovereign cloud)가 중요해졌다. 기존 통신 플랫폼은 데이터 주권을 아키텍처(architecture)를 설계할 때 원칙으로 삼지 않고 단순 배포 옵션으로 취급하여 다중 테넌시(multitenancy) 인프라에 사후 추가하는 데 그쳤다. 마이텔 네트웍스(Mitel Networks Corp.)는 전용 테넌시, 문서화된 데이터 상주(data residency), 독자적 암호화 키 제어 기능을 갖춘 마이텔 고객 경험(Mitel customer experience, Mitel CX) 플랫폼을 선보이며 제품 계층에서 데이터 거버넌스 한계를 해결했다. 시장조사업체 인터내셔널 데이터 코퍼레이션(International Data Corporation, IDC) 유럽 지사는 기업 통신 시장을 일반 규제 대상 집단과 금융 법률이나 국가별 내륙 데이터 처리 규정을 따르는 집단으로 분류했다. 분석 대상 비즈니스 중 3분의 2가 하이브리드 통신 솔루션을 사용하고 있고, 60%는 규제 변화에 맞춰 플랫폼을 바꾸려 고민하고 있다. 영국 셰필드 교육병원 국민보건서비스(Sheffield Teaching Hospitals National Health Service, NHS) 재단 통신 부문 톰 보일(Tom Boyle) 총괄은 주권을 확보하는 일이 클라우드를 단순히 피하거나 혁신을 기피하려는 태도가 아니라, 위기 상황에서 의료 서비스를 지속하며 환자 안전을 보장하려는 전략적 선택이라고 설명했다. 마이텔 CX 플랫폼은 온프레미스(on-premises)와 프라이빗 및 하이브리드 환경을 모두 수용하며, 퍼블릭 클라우드 없이도 고객이 설정한 거버넌스 경계 내에서 생성형 인공지능(generative artificial intelligence, GenAI) 기반 가상 에이전트를 안전하게 통합한다. 또한 위험도에 맞춰 호스팅, 신뢰, 소버린 등 3단계 거버넌스 선택권을 부여해 효율을 높였다. 여러 관할권별 데이터 보존 규제를 준수해야 하는 글로벌 호텔 및 크루즈 운영 등 환대 산업(hospitality) 분야에서도 유용하다. 마이텔이 지속 성장하려면 강화되는 규제에 맞춰 아시아태평양(Asia-Pacific, APAC) 지역으로 신속하게 제품 공급을 확대하고, 이종 인프라가 혼재된 기업 환경을 통합 관리하는 지원책을 강화해야 한다. 아울러 아마존웹서비스(Amazon Web Services, AWS)와 마이크로소프트(Microsoft) 등 글로벌 기술 기업이 주권 중심 클라우드 서비스를 강화하고 있어, 자사 통신 노하우와 거버넌스 아키텍처를 결합한 가치를 영업 현장에서 입증하는 일이 필수적이다.

기사원문 바로가기

 

Mitel CX solves the sovereign cloud problem for communications - SiliconANGLE

Mitel CX solves the sovereign cloud problem for communications - SiliconANGLE

siliconangle.com

 

14. 엔비디아, 1조 개 매개변수 모델 구동 가능한 윈도우용 데스크톱 AI 슈퍼컴퓨터 공개

엔비디아가 대형 데이터 센터가 아닌 개별 개발자 책상에서 직접 작동하는 데스크톱 크기 슈퍼컴퓨터인 윈도우(Windows)용 엔비디아 디지엑스 스테이션(Nvidia DGX Station for Windows)을 지티씨 타이베이(GTC Taipei) 행사에서 공개했다. 마이크로소프트(Microsoft)와 긴밀히 협력해 개발한 장비는 2026년 4분기에 출시될 예정이며, 윈도우 생태계 안에서 상시 작동하는 인공지능(artificial intelligence, AI) 에이전트(agent)를 구축하고 실행하는 데 쓰인다. 그동안 대규모 모델 학습이나 추론 같은 부하가 큰 작업은 리눅스(Linux) 기반 클라우드 데이터 센터(cloud data center)에서 구동해야 했으나, 신제품은 다수 기업이 업무용으로 쓰는 윈도우 환경에서 로컬 개발을 직접 하도록 돕는다. 장비 내부에는 중앙처리장치(central processing unit, CPU)와 그래픽처리장치(graphics processing unit, GPU)를 결합한 엔비디아 지비300 그레이스 블랙웰 울트라 데스크톱 슈퍼칩(GB300 Grace Blackwell Ultra Desktop Superchip)을 장착해 20페타플롭스(petaflops) 연산 성능과 최대 748기가바이트(gigabyte, GB) 메모리를 갖췄다. 강력한 성능을 바탕으로 최대 1조 개 매개변수를 가진 대형 모델을 로컬 환경에서 단독으로 실행하거나 수백 개 에이전트를 동시에 작동시킨다. 보안을 유지하고자 마이크로소프트 보안 기술을 적용한 오픈소스(open source) 프로그램인 엔비디아 오픈셸(OpenShell)을 써서 격리된 가상 환경인 샌드박스(sandbox) 안에서 에이전트를 안전하게 돌릴 수 있다. 에이전트가 시스템 수준에서 통제를 받아 사내 보안 규정을 그대로 지키며, 관리자는 마이크로소프트 관리 도구를 써서 전체 기기를 관리한다. 델 테크놀로지스(Dell Technologies), 에이치피(HP), 에이수스(ASUS)를 포함한 여러 제조 협력사를 거쳐 2026년 말까지 다양한 형태로 시장에 공급된다.

기사원문 바로가기

 

With DGX Station for Windows, Nvidia squeezes 1 trillion-parameter AI supercomputer into a deskside form factor - SiliconANGLE

With DGX Station for Windows, Nvidia squeezes 1 trillion-parameter AI supercomputer into a deskside form factor - SiliconANGLE

siliconangle.com

 

15. 원더쉐어(Wondershare), 인공지능(artificial intelligence, AI) 기반 작업 흐름 최적화 기능 탑재한 통합 피디에프(portable document format, PDF) 솔루션 피디에프엘리먼트(PDFelement) 공개

문서 작업이 많은 사무실에서는 스캔된 송장 문서를 다룰 때 이미지 기반 파일에서 글자를 추출하고 서식을 수정하며 서명하고 전송하는 작업이 여러 도구로 분산되어 번거롭다. 글로벌 소프트웨어 기업 원더쉐어(Wondershare)가 개발한 통합 피디에프(portable document format, PDF) 솔루션 피디에프엘리먼트(PDFelement)는 문서 관련 모든 단계를 단 하나의 공간으로 통합했다. 피디에프엘리먼트는 광학 문자 인식(optical character recognition, OCR) 기술로 표나 문단 구조를 원본대로 유지하며 글자를 읽어낸다. 다양한 언어를 인식하고 특정 영역 글자만 지정해 추출하는 기술을 갖춰 수많은 문서를 신속하게 정리하도록 돕는다. 사용자는 글자 수정, 주석 달기, 링크 연결, 파일 형식 변경 등을 한 곳에서 모두 해결하여 서식이 깨지거나 작업 흐름이 끊기는 문제를 줄인다. 피디에프 문서를 워드, 엑셀, 파워포인트, 이펍(electronic publication, EPUB)을 포함한 다른 문서 형식으로 한꺼번에 바꿀 수 있다. 인공지능(artificial intelligence, AI)을 결합한 대화형 도구는 긴 계약서나 보고서를 신속하게 요약하고 핵심 조항을 찾아낸다. 통합된 작업 흐름은 문서가 자주 오가는 부서 간 협업 속도를 높이며 작업이 중단되는 현상을 예방한다.

기사원문 바로가기

 

Wondershare PDFelement: One-Click PDF Workflow Optimization — Save Hours Every Day

Managing PDFs still often means juggling OCR websites, editing tools, conversion utilities, and approval platforms across the same workflow. Wondershare PDFelement brings those processes into one productivity-focused workspace built around document-heavy o

www.digitaltrends.com

 

16. 에이수스, 엔비디아 RTX 스파크 플랫폼 탑재한 신형 프로아트 P16 및 P14 노트북 출시

많은 정보기술 기업이 인공지능(artificial intelligence, AI) 개인용 컴퓨터(personal computer, PC) 시장에서 얇은 기기에 신경망 처리 성능을 넣으려고 경쟁할 때, 에이수스(Asus)는 다른 독자적 방식을 선택했다. 에이수스가 새로 발표한 프로아트(ProArt) P16 및 P14 노트북은 엔비디아(Nvidia)가 개발한 알티엑스 스파크(RTX Spark) 플랫폼을 기반으로 구동한다. 알티엑스 스파크 플랫폼은 블랙웰(Blackwell) 설계 구조를 적용한 그래픽 처리장치(graphics processing unit, GPU)와 20코어를 갖춘 그레이스(Grace) 중앙처리장치(central processing unit, CPU)를 하나로 묶은 반도체 패키지다. 에이수스는 신제품이 방대한 입체 그래픽을 작업하고 초고해상도 영상을 편집하는 환경을 지원한다고 설명했다. 사용자는 외부 서버를 거치지 않고 노트북 안에서 직접 인공지능 콘텐츠를 제작하거나 거대 언어모델(large language model, LLM)을 실행할 수 있다. 두 노트북은 기존 제품군보다 더 가볍고 두께도 얇아졌다. 프로아트 P16은 가변 주사율 기능을 갖춘 고주사율 유기발광다이오드(organic light emitting diode, OLED) 패널을 탑재했고, 프로아트 P14는 휴대하기 편한 크기에 선명한 화질을 담았다. 에이수스는 인공지능을 활용하는 창작 작업을 돕고자 크리에이터 허브(Creator Hub), 뮤즈트리(MuseTree), 스토리큐브(StoryCube) 같은 자체 소프트웨어를 노트북에 적용했다. 유명 창작 소프트웨어 개발사들과 제휴한 점 역시 사용자가 기기를 곧바로 유용하게 쓰도록 돕는다. 창작자에게 높은 연산 장치가 왜 필요한지 입증해야 하는 과제가 남았으나, 생성형 인공지능 도구가 주류 창작 소프트웨어 속으로 들어오면서 제품이 지닌 가치도 함께 커지고 있다.

기사원문 바로가기

 

Asus arms its new ProArt P16 and P14 laptops with Nvidia’s beefy RTX Spark processor

The new ProArt P16 and P14 combine slim designs with Nvidia's powerful RTX Spark platform, bringing workstation-class AI performance to creator laptops.

www.digitaltrends.com

 

17. 마이크로소프트, 웹용 원드라이브에 인공지능 기반 파일 자동 이름 변경 기능 도입

마이크로소프트(Microsoft)가 2026년 6월 웹용 원드라이브(OneDrive on the web) 서비스에 인공지능(artificial intelligence, AI) 기반 파일 이름을 바꾸는 기능인 코파일럿 제안 이름 변경(Copilot Suggested Rename)을 선보인다. 사용자가 문서를 올리거나 이름을 바꾸려 할 때 인공지능이 파일 내용을 파악해 명확한 이름 세 가지를 제안한다. 사용자는 대화창이나 알림창에서 추천 이름을 골라 클릭 한 번으로 이름을 바꿀 수 있다. 지원하는 파일 형식은 워드(Word), 파워포인트(PowerPoint), 엑셀(Excel) 등 오피스 문서뿐만 아니라 피디에프(portable document format, PDF), 마크다운(markdown), 이미지 파일까지 아우른다. 이로써 사용자가 기본 파일명을 수동으로 고치는 번거로움을 줄이고 파일을 효율적으로 정리하게 돕는다. 마이크로소프트 365 로드맵(Microsoft 365 Roadmap)에 등록된 기능은 웹 버전 서비스에 먼저 적용된다.

기사원문 바로가기

 

OneDrive is getting an AI feature that names your files so you don’t have to

Copilot Suggested Rename is coming to OneDrive on the web in June 2026, using AI to analyze your file's content and suggest three descriptive names inside the rename dialog.

www.digitaltrends.com

 

18. 마이크로소프트, 엔비디아 알티엑스 스파크 칩 탑재한 서피스 랩톱 울트라 공개

마이크로소프트(Microsoft)는 엔비디아(Nvidia) 알티엑스 스파크(RTX Spark) 칩을 탑재한 서피스 랩톱 울트라(Surface Laptop Ultra)를 발표했다. 서피스 랩톱 울트라는 마이크로소프트가 개발한 제품 가운데 역대 성능이 가장 뛰어나다. 클라우드(cloud) 연결 없이 기기 자체에서 무거운 인공지능(artificial intelligence, AI) 작업을 직접 처리한다. 한 번 충전하면 온종일 작동한다.

기사원문 바로가기

 

Microsoft introduces Surface Laptop Ultra with Nvidia’s RTX Spark chip inside

Microsoft just announced the Surface Laptop Ultra, its most powerful laptop ever. It can run heavy AI workloads entirely on the device, no cloud required, and still last all day on a single charge.

www.digitaltrends.com

 

19. 엔비디아, 공장 자율 운영 에이전트 구축을 위한 청사진 ‘FOX’ 공개

엔비디아(NVIDIA)가 타이베이 컴퓨텍스(COMPUTEX) 전시회에서 자율 공장 관리자 에이전트(autonomous factory manager agent)를 만드는 데 쓰는 공장 운영 청사진(Factory Operations Blueprint, FOX)을 공개했다. 이와 함께 실시간 기계 신호, 품질 시스템, 작업 지시서, 운영 경보를 하나의 의사결정 단계로 묶고 네모클로(NemoClaw), 에이아이큐 블루프린트(AI-Q Blueprint), 네모트론(Nemotron) 공개 모델을 사용해 공장 맞춤형 운영 기반을 구성했다. 데스크톱 인공지능(artificial intelligence, AI) 슈퍼컴퓨터인 디지엑스 스테이션(DGX Station) 환경에 맞춤형 운영 기반을 설계했는데, 여기에 그레이스 블랙웰 울트라 데스크톱 슈퍼칩(Grace Blackwell Ultra Desktop Superchip)을 탑재해 최대 1조 개 매개변수를 지닌 대형 인공지능 모델을 공장에서 직접 구동할 수 있도록 했다. 공장 시스템을 연동하고 타오(TAO) 기술로 인공지능 모델을 자동 학습시키며, 메트로폴리스(Metropolis) 비디오 검색 및 요약(video search and summarization, VSS) 청사진과 옴니버스(Omniverse)를 결합해 지능형 작업 흐름을 제어한다. 기술 공개 이후 대만 제조업체인 폭스콘(Foxconn), 페가트론(Pegatron), 어드밴텍(Advantech), 위스트론(Wistron)이 최초로 현장 적용에 나섰다. 폭스콘은 네모클로를 사용해 제조 운영 멀티 에이전트 시스템(manufacturing operations multi-agent system, MoMClaw)을 구축했고, 센서 신호를 결합해 자연어로 소통하는 환경을 갖춰 근본 원인을 분석하는 시간을 80% 단축하고 노동 생산성을 15% 높일 수 있다고 추산했다. 이어 페가트론은 로봇을 효율적으로 움직여 자산 중복 비용을 15% 줄인다는 계획을 마련했으며, 어드밴텍은 냉난방과 조명 시스템을 스스로 제어하는 에너지 관리 에이전트를 적용해 에너지 소비량을 10% 절감하기로 했다. 위스트론 역시 코스모스(Cosmos)와 네모트론 공개 모델을 도입해 표면 실장 공정에서 발생하는 문제 원인을 분석하고 품질을 감시하는 에이전트를 제작하기 시작했다. 또한 스핀전스(Spingence), 오버뷰 에이아이(Overview AI), 로보플로우(Roboflow), 딥하우(DeepHow) 등 협력사들도 코스모스와 불량 이미지 생성(Defect Image Generation) 기술을 사용해 공장별 맞춤 에이전트 개발에 가세했다. 그 결과 딥하우는 비앙카 보드 조립 과정을 실시간으로 점검하는 에이전트를 폭스콘에 공급해 첫 통과 수율(first-pass yield)을 3% 높였고, 스핀전스는 쿨러마스터(Cooler Master) 공장에서 불량 검출률 99.6%를 달성했다. 동시에 오버뷰 에이아이는 암페놀(Amphenol)이 품질 관리에 쓰는 시각 인공지능 모델 배포 속도를 12배 단축했으며, 로보플로우는 코닝 파이버 옵틱스(Corning Fiber Optics) 공장에 가상 불량 이미지를 공급해 검출 정확도를 향상시켰다. 아울러 메트로폴리스 비디오 검색 및 요약 청사진 3 버전을 정식으로 배포하면서 클로드 코드(Claude Code)나 코덱스(Codex) 같은 외부 에이전트도 비디오 분석 에이전트를 빠르게 개발할 수 있게 되었다.

기사원문 바로가기

 

NVIDIA Factory Operations Blueprint Gives Factories a New AI Brain

The FOX blueprint, a reference design for building an autonomous factory manager agent, delivers total factory visibility for better, faster decision-making.

blogs.nvidia.com

 

🔬 AI 연구·기술 (5건)

1. 동영상 에이전트 모델의 기술적 과제와 미래 전망

엔비디아(NVIDIA)에서 코스모스(Cosmos) 월드 모델(world model) 개발을 주도했던 에단 허(Ethan He) 연구원이 엑스에이아이(xAI)를 거치며 겪은 기술적 경험과 향후 동영상 에이전트(video agent) 기술의 전망을 제시했다. 허 연구원은 엑스에이아이에서 회의를 최소화하고 신속한 실험 반복(iteration) 주기를 확보해 3개월 만에 그록 이매진(Grok Imagine) 0.9의 첫 멀티모달(multimodal) 동영상 모델을 개발하고 배포했다고 설명했다. 동영상 생성 모델을 학습하려면 텍스트와 동영상이 일대일로 짝지어진 정교한 합성 설명(synthetic caption) 데이터가 필요하며, 변분 오토인코더(variational autoencoder, VAE)를 거쳐 픽셀(pixel)을 토큰(token)으로 압축해야 한다. 대규모 동영상 데이터는 저장소(storage) 유지와 데이터 전송료(egress)에 따른 비용이 가중되므로 연산 장치 대여 비용보다 자료 보관과 이송에 막대한 비용이 수반된다. 엑스에이아이는 추론(inference) 속도를 높이기 위해 적대적 생성 신경망(generative adversarial network, GAN)이나 일관성 모델(consistency model)을 결합한 단계 증류(step distillation) 기술을 활용해 추론 단계를 대폭 줄였다. 그록 이매진 0.9는 최초로 오디오(audio)와 동영상을 시각화하여 동시에 생성하는 상용 모델이며, 소리와 화면을 실시간으로 일치시키는 정교한 시간 인지 구조가 결합했다. 허 연구원은 시간 정렬(time alignment)을 거쳐 과거의 영상 문맥(context)을 유지하는 동영상 연장(video extension) 기술과 여러 참조 동영상(reference video) 학습을 인터랙티브(interactive) 월드 모델 구현의 첫 단계로 언급했다. 향후 동영상 생성 분야는 1회성 출력에 그치지 않고 스스로 생성 계획을 수립하고 편집을 수행하는 에이전트로 진화하며, 프롬프트 재작성(prompt rewriting) 언어모델의 성능이 결과물의 완성도를 지배하게 된다. 동영상 에이전트 기술이 발달하면 마크업 언어 없이 사용자 의도에서 바로 화면 화소를 실시간으로 생성하는 생성형 사용자 인터페이스(generative user interface, generative UI) 환경으로 이어진다. 허 연구원은 데이터 압축과 문맥을 스스로 관리하는 능력인 자체 문맥 관리(self-managed context) 문제를 규명하고자 대규모 언어모델(large language model, LLM) 연구로 전향하겠다는 향후 계획을 밝혔다.

기사원문 바로가기

 

Why Video Agent models are next — Ethan He, xAI Grok Imagine

Inside xAI: Building Grok Imagine in 3 Months, Videogen vs World Models, and why Grok Imagine is so underrated. For the first time, we do a deep dive with the guy who led it!

www.latent.space

 

2. 오픈에이아이(OpenAI) 모델, 80년 동안 인간이 풀지 못한 유명 수학 난제 해결

헝가리 수학자 펄 에르되시(Paul Erdős)는 1946년 평면 위에 놓인 임의의 점 n개 사이에서 거리가 정확히 1인 점의 쌍이 가질 수 있는 최댓값을 구하는 단위 거리 문제(unit distance problem)를 제시했다. 에르되시는 점의 개수가 많아질 때 단위 거리를 가진 점의 쌍이 점의 개수와 거의 비례하여 완만하게 늘어날 것이라고 추정했다. 오픈에이아이 인공지능(artificial intelligence, AI) 모델은 기하학 구조를 다르게 설계해 이 단위 거리 추측을 반증했다. 고차원 공간에서 격자(grid)를 구성한 뒤 2차원으로 투영하는 기법을 활용했다. 정수 좌표 대신 대수적 정수(algebraic integer)를 사용하여 점들을 배치해 더 많은 단위 거리 쌍을 얻었다. 수학자 윌 소윈(Will Sawin)은 이 결과를 바탕으로 점 n개에 대해 단위 거리 쌍의 수가 최소 n의 1.014제곱 비율로 늘어난다는 사실을 입증했다. 추측을 반증하려면 다른 수학 분야인 대수적 수론(algebraic number theory)에 관한 지식이 필요했다. 인공지능은 넓은 분야의 수학 지식을 학습했기 때문에 두 학문을 연결할 수 있었다. 인간 수학자는 성공률이 낮고 시간이 오래 걸리는 증명 방식을 지속하기 어렵다. 반면 인공지능은 막대한 반복 계산을 통해 여러 시도를 신속히 처리할 수 있다. 수학자들은 인공지능이 인간을 대체하는 대신 난제 해결을 돕는 협력자로 자리 잡을 것이라고 내다본다. 실제로 이번 연구도 인공지능이 증명한 결과를 인간 수학자들이 확인하고 보완하여 함께 완성했다.

기사원문 바로가기

 

An OpenAI model solved a famous math problem that stumped humans for 80 years

I tried to explain OpenAI’s solution more clearly than OpenAI did.

arstechnica.com

 

3. 지나치게 친근한 인공지능 챗봇에 대한 사용자 거부감 확인

사용자들은 지나치게 활기차거나 감정이 과장된 비서보다 자신의 성격과 소통 방식에 부합하는 인공지능(artificial intelligence, AI) 챗봇(chatbot)을 선호한다는 연구 결과가 나왔다. 미국 노스이스턴 대학교(Northeastern University) 연구진이 발표하고 기술 전문 매체 테크 엑스플로어(Tech Xplore)가 보도한 연구에 따르면, 챗봇의 감정 표현을 극대화하는 개발 방식이 무조건 사용자 경험(user experience, UX)을 향상시키지는 않으며 사용자와 챗봇 간의 성격 호환성(personality compatibility)이 상호작용에 중요한 역할을 하는 것으로 나타났다. 연구진은 내성적인 사용자가 차분하고 직설적인 대화 방식을 선호한 반면 외향적인 사용자는 활기찬 어조에 더 긍정적으로 반응했다고 설명했다. 반면 맥락에 관계없이 일방적으로 과도하게 열정적이거나 친근한 태도를 보이는 챗봇에 대해서는 대다수 사용자가 거부감을 드러냈고, 강요된 친밀함이 인공지능에 대한 신뢰도를 낮추고 대화 중 피로감을 유발하는 원인으로 밝혀졌다. 오픈에이아이(OpenAI), 구글(Google), 마이크로소프트(Microsoft), 메타(Meta) 등 주요 기술 기업이 인간처럼 말하는 대화형 인공지능(conversational AI) 개발에 투자를 집중하고 있지만, 과도하게 밝은 인공지능 비서가 역효과를 초래할 수 있다는 지적이다. 이에 따라 향후 인공지능 설계는 획일화된 성격을 제공하는 대신 사용자의 선호와 대화 이력을 바탕으로 어조와 말의 속도를 조절하는 개인맞춤형 방식으로 변화할 전망이다.

기사원문 바로가기

 

It’s not just you. Research says people don’t like overtly friendly AI chatbots

New research suggests users prefer AI chatbots that match their personality instead of assistants that sound excessively cheerful or emotionally exaggerated.

www.digitaltrends.com

 

4. 대규모 언어모델(large language model, LLM) 한계 극복을 위한 에이전트 로직의 필요성과 기업용 인공지능(artificial intelligence, AI) 도입 확장

많은 기업이 인공지능(artificial intelligence, AI) 시범 사업에서 실패를 겪으며, 확장 가능한 도입을 위해 인공지능이 업무 핵심 흐름에서 작동해야 한다는 주장이 제기된다. 대규모 언어모델(large language model, LLM)의 문맥 창이 확대되었으나 환각과 토큰 소모량 증가 같은 한계가 발생한다. 아이비엠(International Business Machines, IBM) 연구소는 지식 그래프(knowledge graph)나 프로그램 분석(program analysis) 기술을 포함한 에이전트 로직(agent logic) 소프트웨어 프리미티브(software primitive)를 도입해 인공지능 에이전트가 모델의 컨텍스트 공간을 제어하도록 유도했다. 메인프레임 현대화를 지원하는 더블유씨이에이포제트(watsonx Code assistant for Z, WCA4Z)는 레거시 코드를 분석하는 과정에서 정적 분석 정보를 사전에 구조화해 토큰 소모량을 30배 절약했다. 테스트 생성을 돕는 아스터(Aster) 도구는 자바 애플리케이션 분석 자료를 활용해 커버리지를 최대 45% 개선했고 일반 코딩 에이전트보다 15배 적은 토큰으로 유닛 테스트(unit test)를 마쳤다. 인스타나(Instana) 사고 조사 에이전트는 지식 그래프 기반 추론으로 지피티(Generative Pre-trained Transformer, GPT)-5.1 기반 리액트(ReAct) 에이전트 대비 장애 분석 성능을 4배 끌어올렸다. 버그 수정 과정에 제미나이(Gemini) 2.5 플래시를 도입해 토큰 소모를 5.9배 줄였고 코딩 에이전트보다 디버깅 성공률이 1.6배 증가했다. 소브린 코어(Sovereign Core)의 규제 준수 에이전트는 알고리즘 기반 계획 수립으로 규제 준수 자동화 성공률을 80% 이상 확보했다. 정책 기반 지배구조 시스템을 장착한 설정형 범용 에이전트(configurable generalist agent, CUGA)는 정책 코드화(policy-as-code) 제어로 안전한 업무 수행 능력을 15%에서 26% 향상했다. 맥시모 컨디션 인사이트(Maximo Condition Insights) 자산 관리 에이전트는 지향성 비순환 그래프(directed acyclic graph, DAG) 기반 분석으로 전문가의 판단을 돕고 자산 분석 시간을 15분에서 15초로 줄였다.

기사원문 바로가기

 

Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic

A Blog post by IBM Research on Hugging Face

huggingface.co

 

5. 물리적 인공지능(physical AI) 추론과 행동 제어를 위한 최초의 공개형 옴니모델 엔비디아 코스모스 3(NVIDIA Cosmos 3) 출시

엔비디아(NVIDIA)가 물리적 인공지능(physical AI) 개발을 위해 최초로 공개하는 옴니모델(open omni-model) 코스모스 3(Cosmos 3)를 허깅 페이스(Hugging Face)에 출시했다. 코스모스 3는 세계 생성, 물리 추론, 행동 제어 기능을 단일 모델로 통합한 세계 기반 모델(world foundation model, WFM)이다. 기존에는 세계나 정책을 생성하려고 여러 모델을 따로 사용했으나 코스모스 3는 하나의 순방향 패스에서 다양한 형태의 정보를 처리한다. 코스모스 3는 변환기 혼합(mixture of transformers, MoT) 구조를 기반으로 작동한다. 입력 정보는 다음 토큰을 예측해 추론하는 자기회귀(autoregressive, AR) 영역과 반복적 잡음 제거로 영상을 생성하는 확산(diffusion, DM) 영역으로 나뉜다. 두 영역은 공동 주의집중(joint attention) 방식으로 상호작용한다. 모델은 효율적으로 추론하도록 160억 개 매개변수(parameter) 규모로 만든 코스모스 3 나노(Cosmos 3 Nano)와 대규모 가상 데이터 생성(synthetic data generation, SDG) 및 연구를 위해 640억 개 매개변수 규모로 설계한 코스모스 3 슈퍼(Cosmos 3 Super) 두 가지 버전으로 나뉜다. 코스모스 3 나노는 워크스테이션급 컴퓨터인 RTX 프로 6000(RTX PRO 6000) 그래픽 처리 장치(graphics processing unit, GPU)에서 돌아가며 코스모스 3 슈퍼는 호퍼(Hopper) 및 블랙웰(Blackwell) 아키텍처를 적용한 시스템을 요구한다. 엔비디아는 디퓨저(diffusers) 라이브러리와 연동해 손쉽게 파이프라인을 구성하도록 지원하며 깃허브(GitHub)에서 사후 학습 스크립트와 개발용 요소를 배포한다. 자율주행과 디지털 휴먼 개발 등 물리적 환경을 모사하는 가상 데이터 세트 6종도 함께 공개했다.

기사원문 바로가기

 

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action

A Blog post by NVIDIA on Hugging Face

huggingface.co

 

⚖️ AI 산업·정책 (1건)

1. 오픈AI, 인공지능 규제 정비 및 정당 정치 중립에 관한 입장 발표

오픈AI(OpenAI)는 인공지능(artificial intelligence, AI) 정책 수립과 정치 활동에 관한 공식 입장문을 발표했다. 오픈AI는 선거 캠페인이나 슈퍼 정치활동위원회(political action committee, PAC)에 기부하지 않았다. 정치활동위원회도 직접 설립하지 않았다. 다만 임직원이 개인 자격으로 정치인을 후원하는 활동은 허용한다. 오픈AI는 인공지능 정책이 정파적 대립 구도로 흘러서는 안 된다고 판단했다. 오픈AI는 인위적으로 여론을 조성하는 위장 풀뿌리 여론조작(astroturfing)에 반대한다. 정책 활동에 참여하는 모든 집단에 투명한 정보 공개를 요구했다. 오픈AI는 인공지능 안전 기준을 높이는 정책을 지지한다. 강력한 모델을 사전에 검증하는 정부 규제에도 찬성했다. 인공지능의 미래는 특정 기업이 홀로 결정할 수 없다. 정부, 연구자, 시민사회가 함께 참여해 규범을 만들어야 한다고 설명했다.

기사원문 바로가기

 

Our views on AI policy and political advocacy

Our approach to AI policy and political advocacy, transparency, support for thoughtful regulation and AI safety, and that no outside political group speaks on the company’s behalf.

openai.com

 

💰 AI 투자·시장 (6건)

1. ‘중단되거나 사멸되거나’: 인공지능 붐에 밀려난 챗지피티 이전 세대 스타트업의 몰락

오픈에이아이(OpenAI)와 앤스로픽(Anthropic) 등 생성형 인공지능(generative artificial intelligence) 기업에 2,500억 달러 이상 투자금이 몰리는 와중에 2022년 챗지피티(ChatGPT) 출시 이전에 설립된 스타트업(startup)은 투자 유치에 큰 어려움을 겪는다. 스타트업 분석 업체 피치북(PitchBook)에 따르면 과거 기업가치 10억 달러를 인정받았던 유니콘(unicorn) 기업 가운데 220개가 넘는 회사가 가치 하락 유니콘(fallen unicorn)으로 전락했다. 미국 내 857개 유니콘 기업 중 절반에 가까운 기업이 최소 3년 동안 추가 투자금을 조달하지 못했다. 마지막 투자 유치 시기가 2021년인 스타트업 기업가치는 평균 68% 감소했으며, 2022년에 마지막으로 자금을 조달한 기업은 평균 52% 하락했다. 벤처캐피털(venture capital) 신규 투자금 가운데 약 81%가 2026년 1분기에 인공지능 분야로 집중되며 자금 쏠림 현상이 심해졌다. 인공지능 기술은 소프트웨어 개발 방식을 근본적으로 바꿔 소수의 인력으로도 과거 수백 명의 엔지니어가 하던 작업을 처리할 수 있게 만든다. 많은 인력과 고비용 사업 구조를 가진 기존 스타트업은 생산성이 높아진 인공지능 기반 기업과의 경쟁에서 밀리는 상황이다. 대표적으로 화장품 브랜드 글로시에(Glossier)를 비롯해 속옷 제조사 새비지 엑스 펜티(Savage X Fenty), 건강기능식품 기업 에이쥐원(AG1), 반려동물 사료 스타트업 파머스독(The Farmer’s Dog), 침구 브랜드 브룩클리넨(Brooklinen), 로보어드바이저 베터먼(Betterment), 티켓 예매 플랫폼 시트긱(SeatGeek) 등이 가치 하락을 겪었다. 투자 업계는 인공지능을 중심으로 사업 구조를 개편하지 못하는 기존 스타트업이 자산 매각이나 인력 감축을 거쳐 폐업에 이를 수 있다고 내다본다.

기사원문 바로가기

 

'Disrupted or dead': AI is crushing a generation of startups built before ChatGPT

The AI boom that has funneled more than $250 billion into OpenAI and Anthropic has left hundreds of startups built before ChatGPT's arrival in 2022 stranded.

www.cnbc.com

 

2. 알파벳, AI 인프라 구축 위해 800억 달러 규모 주식 매각 계획 발표

구글(Google LLC) 모회사 알파벳(Alphabet Inc.)이 인공지능(artificial intelligence, AI) 인프라(infrastructure)를 구축하고 연산 능력을 늘리고자 800억 달러 규모 주식을 매각해 자기자본(equity capital)을 조달한다. 이에 따라 버크셔 해서웨이(Berkshire Hathaway Inc.)는 사모 발행(private placement) 계약을 맺고 클래스 A 보통주와 클래스 C 자본주를 각각 50억 달러씩 사들이기로 합의했다. 주당 인수 가격은 클래스 A 주식이 351.81달러, 클래스 C 주식이 348.20달러다. 동시 공모로는 300억 달러를 조달하며 의무전환우선주 예탁주식 150억 달러와 클래스 A 및 클래스 C 보통주 150억 달러를 발행한다. 나머지 400억 달러는 2026년 3분기부터 시장 상황에 맞춰 주식을 수시로 매각하는 시장가 발행(at-the-market, ATM) 프로그램으로 채운다. 알파벳은 인공지능 솔루션과 서비스 수요가 급증하자 연산 기초시설을 확장하고 독자 개발한 칩인 텐서 처리 장치(tensor processing unit, TPU) 생산을 늘리려고 자금 조달을 결정했다. 알파벳은 2026년 설비투자(capital expenditure, CAPEX) 규모를 1,800억 달러에서 1,900억 달러 사이로 예상했으나 2027년에는 투자를 대폭 늘릴 전망이다. 알파벳이 추진하는 이번 주식 매각은 미국 기업 역사상 손에 꼽히는 대형 자기자본 조달 거래다. 주식 매각 계획을 공개한 뒤 알파벳 주가는 지분 가치 희석 우려가 나오며 시간 외 거래에서 소폭 하락했다.

기사원문 바로가기

 

Alphabet unveils plan to sell $80B in shares to fund ongoing AI infrastructure buildout - SiliconANGLE

Alphabet unveils plan to sell $80B in shares to fund ongoing AI infrastructure buildout - SiliconANGLE

siliconangle.com

 

3. 인공지능 하드웨어 수요 폭발로 델 매출 급성장, 스노우플레이크와 앤스로픽도 강세

인공지능(artificial intelligence, AI)을 도입하는 기업이 늘어나며 하드웨어 부문이 다시 활기를 띠고 있다. 델 테크놀로지스(Dell Technologies)는 큰 성과를 거두었다. 매출은 88% 급증했고 주가는 33% 상승했다. 분기 매출은 약 440억 달러에 달했으며 대부분 AI 서버 부문에서 발생했다. 델 테크놀로지스의 완제품 랙 시스템은 높은 그래픽 처리 장치(graphics processing unit, GPU) 가동률을 보였다. 이에 따라 니오클라우드(neocloud) 등 인프라를 구축하는 기업이 선호하는 구매 대상으로 자리 잡았다. 네트워크와 저장 장치를 개별적으로 연결해야 하는 타사 제품과 달리, 델의 완제품 랙은 조립이 완료된 상태로 배송된다. 사전 조립 배송 방식은 설치 시간을 단축해 준다. 데이터 저장 기업 넷앱(NetApp) 역시 최근 주가가 30% 이상 올랐다. 하이퍼스케일러(hyperscaler)나 코어위브(CoreWeave) 같은 인공지능 클라우드 기업이 설비 투자를 줄이면 시장 성장이 정체될 수 있다는 예측도 존재한다. 아울러 대규모 연산을 지원하기 위해 기존 공랭식 데이터센터를 수랭식으로 전환해야 하는 과제도 남아 있다. 스노우플레이크(Snowflake)는 아마존웹서비스(Amazon Web Services, AWS)에서 컴퓨팅 자원을 추가 구매하기로 합의하며 주가가 하루 만에 36% 급등했다. 보안성과 편의성을 높인 스노우플레이크 인텔리전스(Snowflake Intelligence)와 코텍스 코드(Cortex Code) 등의 기능이 실적을 개선하는 데 기여하고 있다. 앤스로픽(Anthropic)은 최근 오픈에이아이(OpenAI)보다 많은 6,500만 달러 규모의 신규 투자금을 유치했다. 경영진 지시와 무관하게 실무자가 비용을 직접 지불하며 니모클로(NemoClaw)나 에어미(Airmee) 같은 인공지능 모델을 내려받아 생산성을 올리는 현상도 발견된다. 개인이 인공지능을 활용하는 방식은 과거 네트워크가 연결되기 전 개인용 컴퓨터(personal computer, PC)를 도입하던 시기와 유사하게 각자 생산성을 끌어올리는 형태로 전개되고 있다.

기사원문 바로가기

 

AI hardware boom drives Dell’s data center growth - SiliconANGLE

Dell’s AI hardware surge highlights rising enterprise demand for compute, GPU utilization and data center infrastructure as the AI boom accelerates.

siliconangle.com

 

4. 인공지능 반도체 수요 폭증으로 고프로 존폐 위기 직면

액션 카메라 제조업체 고프로(GoPro)는 2026년 1분기 매출이 26% 감소했다고 발표했다. 대출 약정을 위반할 가능성이 커지자 고프로는 기업 존속 능력이 불확실하다며 경고했다. 인공지능(artificial intelligence, AI) 데이터센터용 고대역폭 메모리(high bandwidth memory, HBM) 수요 폭증이 재정 위기를 불렀다. 삼성(Samsung)과 에스케이하이닉스(SK Hynix), 마이크론(Micron)을 비롯한 주요 반도체 제조사는 마진이 높은 시장을 공략하려고 웨이퍼(wafer) 생산 능력을 소비자용 디램(dynamic random-access memory, DRAM)에서 고대역폭 메모리로 바꿨다. 그 결과 소비자용 메모리 반도체 가격은 80%에서 115%까지 올랐다. 고프로는 애플(Apple)처럼 가격 협상력을 갖추거나 제품 가격을 올려 비용 상승을 상쇄할 수 없다. 300달러에서 500달러 선인 고프로 기기는 고화질 비디오 저장을 위해 범용 메모리를 쓰기 때문에 부품 가격이 오르면 수익성이 극도로 악화된다. 채무 상환을 유예받았으나 유동성은 여전히 부족하다. 이에 따라 고프로는 지난 4월 글로벌 직원 23%를 줄이겠다고 발표한 데 이어, 매각이나 합병을 포함한 대안을 마련하려고 자문단을 고용했다. 방산 및 우주항공 분야로 사업 영역을 넓히는 방안도 검토하기 시작했다. 중국 창신메모리테크놀로지(ChangXin Memory Technologies, CXMT)가 반도체를 일부 공급하고 있으나, 생산 능력 중 20%를 고대역폭 메모리로 돌릴 계획이어서 공급 부족 현상이 풀리기는 어렵다. 에이수스(Asus)와 델(Dell) 등 여러 제조사도 부품 가격 상승 압박을 받고 있다. 인공지능 열풍이 불러온 반도체 수급 불균형으로 소비자 기기 기업들이 심각한 생존 위협에 노출됐다.

기사원문 바로가기

 

GoPro warned it may not survive. The AI memory crunch is killing companies that make things people hold.

Memory prices rose 80-115%. Revenue fell 26%. GoPro warned of "substantial doubt" about its ability to continue. It's exploring a sale or pivot to defence.

thenextweb.com

 

5. 소프트뱅크, 프랑스 인공지능 인프라에 873억 달러 대규모 투자 결정

소프트뱅크그룹(SoftBank Group)이 프랑스 인공지능(artificial intelligence, AI) 인프라를 세우고자 최대 750억 유로(약 873억 달러)를 투자하기로 결정했다. 발표 소식은 프랑스 베르사유에서 개최한 2026년 ‘Choose France’ 투자 유치 행사에서 전해졌다. 에마뉘엘 마크롱(Emmanuel Macron) 프랑스 대통령과 손정의(Masayoshi Son) 소프트뱅크그룹 회장은 개별적으로 만나 투자 계획을 공식 발표했다. 소프트뱅크그룹은 향후 5년 동안 450억 유로(약 530억 달러)를 우선 투입하여 3.1기가와트(gigawatt, GW) 용량을 갖춘 데이터센터(data center)를 설립한다. 데이터센터는 프랑스 북부 오드프랑스(Hauts-de-France) 지역에 자리한 룬플라주, 보스켈, 부솅에 들어설 예정이다. 이후 사업 대상을 프랑스 전역으로 넓혀 총 용량을 5기가와트까지 확대할 계획이다. 인프라 사업을 원활히 추진하기 위해 프랑스 국영 기업 프랑스전력공사(Électricité de France, EDF)와 슈나이더 일렉트릭(Schneider Electric)이 동참한다. 프랑스전력공사는 가동을 마친 부솅 화력발전소 부지를 내주고 전력을 안정적으로 보낸다. 슈나이더 일렉트릭은 됭케르크 항구에 로봇공학(robotics)과 전력 모듈을 생산하는 산업 단지를 조성한다. 손정의 회장은 프랑스가 안정적으로 가동하는 원자력 발전망을 주된 투자 요인으로 꼽았다. 소프트뱅크그룹이 추진하는 투자는 유럽 전역에서 집행한 인프라 투자 가운데 최대 규모를 기록했다. 프랑스는 이번 대규모 인프라 조성에 힘입어 유럽 내 인공지능 산업 중심지로 올라설 전망이다.

기사원문 바로가기

 

SoftBank Commits $87.3B to France AI Infrastructure Buildout

SoftBank Commits $87.3B to France AI Infrastructure Buildout

aibusiness.com

 

6. 스페이스엑스·앤스로픽·오픈에이아이 거대 기업공개와 미국 주식시장 소화 능력 논란

스페이스엑스(SpaceX)와 앤스로픽(Anthropic), 오픈에이아이(OpenAI)가 미국 주식시장 상장을 준비하고 있다. 세 기업이 모두 상장하면 미국 주식시장에 약 4조 달러에 달하는 시가총액이 더해진다. 유동성이 급격히 쏠리면서 기존 시장에서 거래되던 자금이 마르고 변동성이 커질 것이라는 우려가 나온다. 반면 총 공모 금액이 약 2000억 달러 수준이므로 60조 달러 규모인 미국 주식시장이 공모 자금을 충분히 흡수할 수 있다는 의견도 대립한다. 지수 산출 기관들은 대형 기업을 빠르게 편입하려고 요건을 낮췄다. 에스앤피 500(S&P 500)과 나스닥 100(Nasdaq 100), 에프티에스이 러셀(FTSE Russell) 등이 대표적이다. 분기별 수익성 기준을 면제하거나 상장 후 대기 기간(seasoning window)을 대폭 줄였다. 규정이 바뀌면서 30조 달러가 넘는 퇴직연금(401k)을 비롯한 패시브 펀드(passive fund) 자금이 상장 직후 기계적으로 주식을 사들여야 한다. 인공지능(artificial intelligence, AI) 분야를 주도하는 기업들은 시장 자금을 선점하려고 상장 시기를 경쟁적으로 저울질한다. 시장 분석가들은 수익을 내지 못하는 신생 기업에 막대한 연금 자금이 흘러 들어가면 거품이 끼거나 퇴직자가 손실을 볼 수 있다고 우려한다.

기사원문 바로가기

 

Can the stockmarket swallow Anthropic, SpaceX and OpenAI?

Watch out for indigestion

www.economist.com

 

🛡️ AI 윤리·안전 (3건)

1. 앤스로픽 브라우저 에이전트, 안전 장치 작동 전 프롬프트 주입 공격에 31.5% 탈취

프롬프트 주입(prompt injection)은 인공지능(artificial intelligence, AI) 에이전트(agent)가 읽는 문서나 웹 페이지에 악성 명령을 숨겨 비인가 작업을 실행하게 만드는 공격 기법이다. 인공지능 기술을 쓰는 기업이 늘어나면서 위협 강도도 거세지고 있다. 크라우드스트라이크(CrowdStrike)가 발표한 보고서에 따르면, 공격자들은 기존 방어 체계가 대응하기 전에 침투를 끝내는 속도로 움직인다. 앤스로픽(Anthropic)은 최신 인공지능 모델 오퍼스 4.8(Opus 4.8) 시스템 카드(system card)에서 브라우저(browser) 에이전트가 안전 장치 없이 구동할 때 공격자에게 탈취당할 확률이 31.5%에 달한다고 밝혔다. 오퍼스 4.8 공격 성공률은 소넷 4.6(Sonnet 4.6)이 기록한 50.7%에 비해 낮아진 수치며, 개발 중인 미토스 프리뷰(Mythos Preview)는 5.9%까지 떨어졌다. 안전 장치를 켜면 오퍼스 4.8 공격 성공률은 0.5%로 줄어들고, 사고 프로세스(thinking) 기능마저 끄면 탈취당할 확률이 없다. 반면 오픈AI(OpenAI)와 구글(Google), 메타(Meta)를 비롯한 경쟁사들은 자사 모델이 탈취당할 구체적 확률을 밝히지 않았다. 오픈AI는 지피티-5.5(GPT-5.5) 시스템 카드에 커넥터(connector) 견고성 점수를 0.963으로만 기재했다. 구글은 관련 안전 정보를 별도 문서로 분리해 실었으며 메타는 모델 카드를 공개하지 않았다. 보안 업계는 프롬프트 주입 공격을 측정하는 통일된 업계 표준이 없다는 점을 주요 원인으로 지목한다. 리퓨테이션(Reputation) 카터 리스(Carter Rees) 부사장은 프롬프트 주입이 기존 보안 솔루션 탐지 패턴과 완전히 달라 방어가 어렵다고 진단했다. 크라우드스트라이크 애덤 메이어스(Adam Meyers) 부사장도 인공지능을 도입해 보안 취약 지점이 늘어난 만큼 기업이 직접 모델 보호 대책을 세워야 한다고 강조했다.

기사원문 바로가기

 

Prompt injection disclosures: 4 labs compared

Anthropic, OpenAI, Google, and Meta published prompt injection disclosures in 2026 — but no two measure the same thing. What security teams need to know.

venturebeat.com

 

2. 플로리다주, 사용자 착취 및 범죄 악용 방조 혐의로 오픈AI와 샘 올트먼 고소

플로리다주 법무장관(Attorney General) 제임스 우스마이어(James Uthmeier)가 오픈AI(OpenAI)와 최고경영자(chief executive officer, CEO) 샘 올트먼(Sam Altman)을 상대로 민사 소송을 제기했다. 이번 소송은 챗GPT(ChatGPT)가 총기 난사나 자살 등 강력 범죄와 자해를 모의하는 데 도구로 쓰인 정황이 드러난 데 따른 법적 조치다. 우스마이어 법무장관은 소장에서 오픈AI가 제품 위험성을 알고도 기업 가치를 높이려고 안전 관리에 소홀했으며 사용자를 속였다고 주장했다. 구체적으로 오픈AI는 기만적 거래 행위, 과실, 제조물 책임(product liability) 위반, 사기성 왜곡 표명, 공공 불법 방해를 저지른 혐의를 받는다. 지난해 플로리다 주립대학교(Florida State University)에서 일어난 총기 난사 사건 피의자는 범행 전 챗GPT와 대화하며 무기 선택과 언론 관심을 끄는 법을 조언받았다. 올해 사우스플로리다 대학교(University of South Florida) 인근에서 발생한 살인 사건 피의자도 시신을 숨기는 방법을 챗GPT에 물었다. 캐나다 브리티시컬럼비아주에서 발생한 총기 난사 사건에서도 피의자가 챗GPT를 자주 사용했으며, 오픈AI는 폭력을 계획하는 정황을 파악하고도 계정만 차단했을 뿐 당국에 알리지 않았다. 챗GPT가 사용자가 자살 계획을 세우도록 도왔다는 의혹을 포함해 오픈AI는 강력 범죄나 자해를 조장한 혐의로 적어도 8건의 소송에 걸려 있다. 플로리다 주정부는 오픈AI가 챗GPT가 잘못되거나 터무니없는 정보를 줄 수 있다는 환각(hallucination) 가능성을 광고에서 숨겼으며, 사용자를 붙잡아 두려고 비위 맞추기(sycophancy) 대화 구조를 적용했다고 지적했다. 오픈AI는 시스템을 구축하는 과정마다 안전장치를 마련했으며 민감한 대화를 누그러뜨리도록 유도한다고 해명했다. 반면 주정부는 올트먼 대표가 무모한 운영으로 플로리다 주민에게 피해를 준 책임을 개인적으로 져야 한다고 명시했다.

기사원문 바로가기

 

Florida sues OpenAI and Sam Altman over alleged 'exploitation of users' - Engadget

Florida's lawsuit against OpenAI comes after a mass shooter at FSU reportedly consulted ChatGPT to plan the attack.

www.engadget.com

 

3. 메타 AI 고객 지원 챗봇 취약점 악용한 인스타그램 계정 대규모 탈취 사건 발생

해커들이 메타(Meta)가 운영하는 고객 지원용 인공지능(artificial intelligence, AI) 챗봇(chatbot)에 존재하는 보안 취약점을 이용해 인스타그램(Instagram) 계정을 무단으로 탈취했다. 공격자는 가상 사설망(virtual private network, VPN)을 사용해 접속 위치를 우회함으로써 보안 체계를 속였다. 공격자가 챗봇에게 다른 이용자 계정에 등록된 이메일 주소를 변경해 달라고 요구하자, 챗봇은 다중 요소 인증(multi-factor authentication, MFA)이나 본인임을 확인하는 절차를 거치지 않고 요청을 즉시 처리했다. 공격자는 본인이 등록한 이메일로 비밀번호 재설정 링크를 전송받아 계정 제어권을 가로챘다. 탈취 피해를 본 계정에는 버락 오바마(Barack Obama) 전 미국 대통령의 인스타그램 계정과 화장품 소매업체 세포라(Sephora), 미국 우주군 주임원사 존 벤티베냐(John Bentivegna)의 계정이 포함됐다. 공격을 받아 탈취된 고가치 계정은 100개 이상으로 집계됐다. 보안 전문가들은 인공지능 기술로 고객 지원 업무를 자동화할 때 나타나는 보안 허점이 실제로 노출됐다고 평가했다. 메타 대변인 앤디 스톤(Andy Stone)은 취약점을 보완했으며 피해를 입은 계정을 복구하도록 돕고 있다고 발표했다.

기사원문 바로가기

 

Meta’s own AI was exploited to hijack Instagram accounts

Does this count as vibe hacking?

www.theverge.com

 

반응형