| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 글로벌경제
- 노사정위원회
- AAPL
- 국제정세
- 입법동향
- 미국주식
- 시각화
- 코퍼러티즘
- 리서치
- 기업분석
- 노사정
- 협동조합주의
- GE 매트릭스 # BCG 매트릭스 # 사업포트폴리오 (Business Portfolio) 분석기법 # 경영평가 도구
- S&P500
- HTML원본
- 논문리뷰
- 사회적 합의주의
- 조합주의
- 데이터분석
- 노동조합
- 법안
- Coiporatism
- 파티시즘
- 국회
- 머신러닝
- Ai
- 블룸버그
- Today
- Total
데이터샤우츠
[2026-05-18 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 본문
🏢 AI 기업·비즈니스 (8건)
1. 오픈AI, 그렉 브록먼 주도 하에 챗GPT와 코덱스 통합... 단일 에이전틱 플랫폼 구축 박차
오픈AI 공동 창립자이자 사장인 그렉 브록먼이 회사 제품 전략을 총괄하면서 챗GPT, 코덱스(Codex), 개발자 API를 단일 제품 조직으로 통합한다. 브록먼은 내부 메모에서 오픈AI가 단일 에이전틱 플랫폼(agentic platform)에 투자하고 챗GPT와 코덱스를 하나의 통합된 에이전틱 경험으로 합치겠다고 밝혔다. 그동안 여러 프로젝트를 병행하며 끌어온 ‘사이드 퀘스트(side quests)‘를 끝내고 개발 전략을 한 곳에 모으겠다는 뜻이다. 이번 통합으로 오픈AI는 AI 모델이 스스로 계획을 세우고 실행하는 에이전틱 AI 개발에 더 속도를 낼 것으로 보인다.
OpenAI merges ChatGPT and Codex under Greg Brockman. The side quests are over.
Brockman takes permanent control of product strategy, merging ChatGPT, Codex, and the API into one agentic platform ahead of a potential Q4 IPO.
thenextweb.com
2. OpenAI, 몰타 전역에 ChatGPT Plus 구독 제공… 정부와 협력한 AI 확산 첫 사례
인공지능(AI) 기업 OpenAI가 몰타 정부와 협력해 몰타 전역에 유료 구독 서비스인 ChatGPT Plus를 제공한다. OpenAI가 정부와 손잡고 AI 서비스를 전국 단위로 펼치는 첫 시도다. 이번 파트너십으로 몰타의 모든 시민이 ChatGPT Plus의 향상된 기능과 빠른 응답 속도, 우선 접근권을 누릴 수 있게 된다. OpenAI는 이번 협력이 AI 기술의 문턱을 낮추고 국가 차원에서 AI를 쓰는 새로운 모델을 제시할 것으로 기대한다. 이 사업은 AI를 공공 서비스와 국가 인프라에 어떻게 녹여낼 수 있는지 보여주는 중요한 사례가 될 전망이다. OpenAI는 앞으로 다른 국가 정부와도 비슷한 협력을 모색할 가능성을 내비치며, AI 기술의 사회적 확산을 위한 행보를 이어간다.
OpenAI is giving ChatGPT Plus subcription to a whole country
OpenAI has partnered with Malta to provide nationwide access to ChatGPT Plus, marking one of the company’s most ambitious government AI rollouts yet.
www.digitaltrends.com
3. 아마존 직원들, AI 사용률 부풀리기 위해 가짜 업무 수행 보고
아마존 직원들이 사내 AI 도입률 수치를 부풀리려고 불필요한 업무에 인공지능(AI)을 끌어다 쓴다는 보고가 나왔다. 기업들이 경쟁적으로 업무 환경에 AI를 확대하는 가운데, 일부 직원은 AI 사용량을 늘리라는 압박에 시달리면서 실제 업무와 무관한 가짜 작업을 만들어 AI를 돌리고 있다고 전해진다. 이런 흐름은 AI 도입의 실제 효과와 효율성에 의문을 던지면서, 기업의 AI 활용 정책과 성과 측정 방식을 다시 들여다봐야 한다는 목소리로 이어진다. AI 기술이 빠르게 퍼지면서 예상하지 못한 부작용이 드러난 셈이고, 앞으로 기업들이 AI 전략을 짤 때 무겁게 받아들여야 할 대목이다.
Amazon employees are doing fake tasks because they’re forced to use more AI and show it
Amazon employees are reportedly using AI for unnecessary tasks to inflate internal usage metrics as companies continue aggressively pushing workplace AI adoption.
www.digitaltrends.com
4. AI가 창조한 7가지 신규 직무: 클로드 에반젤리스트부터 최고 AI 책임자까지
인공지능(AI) 산업이 빠르게 커지면서 기존 직무를 바꾸는 데 그치지 않고 새로운 직책을 만들어내고 있다. 불과 2년 전만 해도 없던 자리가 조직도에 올라오고, 일부는 옛 직업이 기술 산업에서 다시 태어난 모습을 띤다. AI 기업들은 새 직무를 뽑아 조직 구조를 다시 짜고 있다. 예를 들어 ‘클로드 에반젤리스트(Claude Evangelist)‘는 특정 AI 모델의 활용법을 알리고 사용자를 돕는 역할을 맡는다. ‘최고 AI 책임자(Chief AI Officer)‘는 기업의 AI 전략을 세우고 실행 전반을 총괄한다. ‘AI 철학자(AI Philosopher)‘는 AI가 미칠 윤리적, 사회적 영향을 깊이 들여다본다. ‘AI 트레이너(AI Trainer)‘는 모델 성능을 끌어올리려 데이터를 학습시키고 미세 조정을 수행한다. ‘AI 검증 전문가(AI Auditor)‘는 AI 시스템의 정확성과 공정성, 투명성을 평가한다. ‘AI 윤리 책임자(AI Ethics Officer)‘는 AI를 개발하고 배포하는 과정에서 불거질 윤리 문제를 미리 막고 관리한다. ‘AI 기반 제품 관리자(AI Product Manager)‘는 AI 기술을 얹은 신제품 기획부터 시장 출시까지 이끈다. 새 직무가 줄지어 등장하는 현실은 AI 기술이 작업 방식만 바꾸는 데 그치지 않고 고용 시장 전반을 근본부터 흔들고 있다는 사실을 보여준다.
The seven new job titles that AI created, from Claude Evangelist to Chief AI Officer
AI companies are hiring philosophers, evangelists, vibe coders, and forward deployed engineers. The salaries start at $108K and reach nearly $500K.
thenextweb.com
5. 벤쿠버 시장, 11개 AI 에이전트 활용 사실 인정 후 번복
캐나다 밴쿠버의 켄 심(Ken Sim) 시장이 처음에는 AI 도구를 개인 용도로만 쓴다고 했다가, 11개의 AI 에이전트에게 업무를 맡겨 온 사실을 인정하며 기존 발언을 뒤집었다. 심 시장은 시 정부 운영 효율을 끌어올리려 이 AI 에이전트들을 동원했다고 설명했다. 이번 사안은 공직 사회가 AI 기술을 어디까지 끌어들여 써야 하는지를 둘러싼 논쟁에 불을 붙였고, 투명성과 책임 있는 AI 도입이 왜 중요한지 다시 짚게 만들었다. 심 시장은 AI가 시민에게 더 나은 행정 서비스를 제공하는 데 보탬이 될 것이라고 주장했다.
Mayor Eats His Words After Admitting He's Delegating Work to 11 AI Agents
Vancouver Ken Sim has been forced to walk back a statement he made this week about his AI usage. His reputation now appears to be at stake.
futurism.com
6. 기업, 과잉 생성된 AI 에이전트 문제에 직면하다
기업들이 의도치 않게 과도하게 생성된 인공지능(AI) 에이전트 문제에 직면했다. 일부 기업에서는 직원들이 업무 효율성을 높이기 위해 여러 AI 도구를 도입했으나, 수많은 AI 에이전트가 중복적으로 생성되어 관리가 어려워졌다. 상황은 AI 기술의 빠른 발전과 기업 내 도입 확산 속에서 발생하며, AI 에이전트의 효율적인 관리 및 통제 시스템 구축의 필요성을 부각한다. 향후 기업들은 AI 에이전트의 생성 및 운영에 대한 명확한 가이드라인을 수립하고, 중복성을 최소화하며 통합적으로 관리할 수 있는 방안을 모색해야 할 것으로 보인다.
Oops: Bosses Realize Their Companies Have Been Swarmed by Legions of Redundant AI Agents
Executives are now grappling with the overflow of expensive and redundant AI agents that they ushered in in the first place.
futurism.com
7. 델, 기업 AI 전환 가속화 위한 파트너십 확대… 엔터프라이즈 인프라 시장 재편 주도
엔터프라이즈 인프라 시장에서 델 테크놀로지스(Dell Technologies Inc.)가 기업의 인공지능(AI) 전환을 지원하기 위해 전략적 파트너십을 대폭 확장하며 시장 재편을 주도하고 있다. 델은 ‘빅 텐트’ 전략을 통해 협력사 범위를 넓히며 기업 AI 접근 방식을 강화하고 있으며, 이는 곧 엔터프라이즈 인프라 시장의 중요한 변화를 의미한다. 움직임은 기업들이 AI 도입을 가속화하고 경쟁 우위를 확보하려는 노력의 일환으로 분석된다. 델은 다양한 파트너들과의 협력을 통해 기업들이 AI를 성공적으로 도입하고 활용할 수 있도록 지원하는 데 집중하고 있다.
Enterprise infrastructure driven by Dell partnerships - SiliconANGLE
Enterprise infrastructure is shifting as Dell expands AI, cloud and virtualization partnerships with Nvidia, Nutanix, AMD and Microsoft for hybrid AI ops.
siliconangle.com
8. AI, 자동차 업계 화이트칼라 일자리 감소 가속화 전망
미국 주요 자동차 제조사 제너럴 모터스(GM), 포드, 스텔란티스가 올해 들어 2만 개 이상의 화이트칼라 일자리를 줄인 것으로 나타났다. 해당 기업들의 전체 화이트칼라 인력의 19%에 해당하는 규모다. 특히 GM은 최근 500명에서 600명에 달하는 IT 부문 직원을 해고하며 추세를 가속화했다. 일자리 감소는 순전히 인공지능(AI)의 영향만으로 설명되지는 않지만, AI 기술의 발전이 향후 자동화 및 효율성 증대를 통해 화이트칼라 직무의 필요성을 더욱 줄일 것이라는 전망이 나온다. AI는 이미 다양한 산업 분야에서 반복적인 사무 업무를 자동화하고, 데이터 분석 및 의사결정 과정을 지원하며, 생산성을 향상시키는 데 활용되고 있다. 자동차 업계 역시 AI의 잠재력을 활용하여 비용 절감과 효율성 극대화를 추구할 가능성이 높다. 이에 따라 앞으로 자동차 산업뿐만 아니라 다른 산업에서도 AI로 인한 화이트칼라 일자리 감소 추세가 더욱 두드러질 것으로 예상된다.
GM, Ford, and Stellantis have cut 20,000 white-collar jobs. AI is about to accelerate the trend.
Detroit's Big Three shed 19% of their combined salaried workforce since 2022. GM just cut 500 more IT workers as it hires for 250 AI positions.
thenextweb.com
🚀 AI 제품·서비스 (4건)
1. 애플, 시리(Siri)에 자동 삭제 기능 탑재 검토
애플이 새로운 시리(Siri) 앱에 대화 자동 삭제 기능을 도입한다는 보도가 나왔다. 블룸버그 통신에 따르면 사용자는 대화 기록을 30일, 1년, 영구 보존 가운데 하나를 골라 적용할 수 있다. 개인 정보 보호를 강화하고 데이터 관리 편의성을 끌어올리려는 조치로 풀이된다. 구체적인 도입 시점이나 적용 범위는 아직 공개되지 않았다. 다만 AI 비서 서비스 전반에서 프라이버시 기능을 강화하는 흐름과 맞닿아 있다는 해석이 나온다.
Apple's new Siri app will reportedly offer auto-deleting chat options - Engadget
Users can choose between keeping conversations for 30 days, one year or forever, according to Bloomberg.
www.engadget.com
2. 토큰 효율성 98% 개선한 코드 검색 도구 ‘Semble’ 공개
개발자 Stephan과 Thomas가 인공지능(AI) 에이전트가 대규모 코드베이스에서 정보를 찾을 때 발생하는 토큰 사용량 과다 문제를 풀기 위해 오픈소스 코드 검색 도구 ‘Semble’을 공개했다. 기존 grep 같은 도구는 파일 전체를 읽거나 하위 에이전트를 돌리면서 토큰을 많이 쓰고도 관련 코드를 놓치는 일이 잦았다. Semble은 정적 Model2Vec 임베딩과 BM25를 RRF(Reciprocal Rank Fusion)로 합친 뒤 코드 인식 신호로 재순위를 매겨 동작한다. 트랜스포머(transformer) 모델을 쓰지 않아 모든 처리가 CPU에서 돌아가고, 벤치마크에서는 grep+read 대비 토큰 사용량을 98% 줄이면서도 1370만 개 매개변수를 가진 코드 학습 트랜스포머의 검색 품질 99% 수준에 도달했다. 속도도 200배 빠르며, Claude Code, Cursor, Codex, OpenCode 등에서 Claude Code의 MCP(Model-Centric Programming) 서버로 바로 붙여 쓸 수 있다. 설치는 ‘claude mcp add semble -s user --uvx --from “semble[mcp]” semble’ 명령어 한 줄로 끝난다.
GitHub - MinishLab/semble: Fast and Accurate Code Search for Agents. Uses ~98% fewer tokens than grep+read
Fast and Accurate Code Search for Agents. Uses ~98% fewer tokens than grep+read - MinishLab/semble
github.com
3. 노트북 대신 XR 헤드셋, 태블릿, 스마트폰으로 30일간 업무 환경을 바꾼 경험
한 IT 전문 기자가 30일 동안 노트북을 대신해 확장현실(XR) 글래스, 헤드셋, 태블릿, 스마트폰 등 다양한 기기로 업무 환경을 전환하며 얻은 경험을 공유한다. 이 과정에서 노트북이 제공하는 휴대성과 생산성의 균형을 대체할 만한 ‘미래형’ 업무 환경의 가능성과 한계를 탐색했다.또한, 태블릿은 휴대성과 생산성 사이에서 균형을 잡았지만, 전문적인 작업에는 한계가 있었다. 스마트폰은 이동 중 간단한 작업에 적합했지만, 장시간 사용에는 불편함이 따랐다. , 이 기자는 노트북의 범용성과 효율성을 완전히 대체할 만한 단일 기기나 시스템을 찾지 못했으며, 각 기기의 장점을 결합하는 하이브리드 방식이 현재로서는 가장 현실적인 대안이라고 결론 내렸다. 향후 XR 기술의 발전과 함께 미래형 업무 환경의 가능성이 더욱 커질 것으로 전망한다.
I tried ditching my laptop for a more futuristic setup - and found 5 surprising alternatives
From XR glasses to headsets to tablets, here's how various work systems fared over 30 days.
www.zdnet.com
4. 빈 자율주행차 ‘웨이모’ 수십 대, 애틀랜타 교외 도는 소동
미국 애틀랜타의 한 교외 지역에서 자율주행차 ‘웨이모(Waymo)’ 수십 대가 몇 시간 동안이나 특정 지역을 맴도는 기현상이 발생했다. 목격자들은 최소 8대의 웨이모가 막다른 길에서 빠져나오지 못하고 뱅글뱅글 돌거나, 특정 구간을 반복해서 주행하는 모습을 목격했다고 전했다. 이 차량들은 승객 없이 운행 중이었으며, 몇몇 차량은 3시간 이상 해당 지역에 머물렀다. 웨이모 측은 당시 해당 지역에서 로컬 서비스 제공을 위한 테스트를 진행 중이었으며, 특정 경로에서 예상치 못한 문제가 발생하여 차량들이 멈추거나 경로를 재탐색하는 과정에서 상황이 발생했다고 해명했다. 웨이모는 문제를 인지하고 수정했으며, 현재는 정상적으로 운영되고 있다고 밝혔다. 이번 사건은 자율주행 기술이 실제 도로 환경에서 겪을 수 있는 예상치 못한 문제와 그로 인한 혼란 가능성을 보여주는 사례로 주목받고 있다.
Swarm of Empty Waymos Descends on Unsuspecting Suburb, Circle Cul-de-Sacs for Hours on End Like Strange Ghosts
Residents of one Atlanta suburb are concerned as their otherwise sleepy streets become a gathering place for Waymos.
futurism.com
🔬 AI 연구·기술 (7건)
1. 벡터 검색 넘어선 그래프 강화 RAG, 기업 데이터 활용 새 지평 열어
기존 검색 증강 생성(Retrieval-Augmented Generation, RAG)은 문서 내용을 벡터 데이터베이스에 저장하고 유사도로 정보를 찾아내는 데 강점을 보였다. 다만 공급망, 금융 규정 준수, 사기 탐지처럼 요소들이 촘촘히 얽힌 기업 환경에서는 구조적 정보를 놓치는 한계가 드러났다. 가령 ‘부품 X의 지연이 고객 Y에 대한 당사의 3분기 결과에 어떤 영향을 미칠까?’와 같이 여러 단계를 거쳐 추론해야 하는 질문에는 벡터 검색만으로 명확히 답하기 어려웠다. 벡터 저장소가 부품 X와 고객 Y의 납품 일정 사이에 어떤 관계가 있는지 ‘알지’ 못하기 때문이다. 이런 문제를 풀기 위해 벡터 검색의 의미론적 유연성과 그래프 데이터베이스의 구조적 결정론을 묶은 그래프 강화 RAG(Graph-Enhanced RAG) 아키텍처가 제안됐다. 메타(Meta)에서 로그 시스템을 만들고 코그니(Cognee)에서 개인 데이터 인프라를 다룬 경험을 바탕으로 한 접근으로, 데이터를 받아들이는 단계부터 개체(노드)와 관계(엣지)를 뽑아 그래프 데이터베이스에 저장하고 벡터 임베딩은 노드의 속성으로 붙여 쓴다. 검색 시점에는 먼저 벡터 검색으로 초기 진입점을 잡고, 이어 그래프 탐색으로 관련 정보를 모아 LLM에 구조화된 페이로드를 넘긴다. 그 결과 LLM은 단순한 텍스트 덩어리가 아니라 관계가 또렷이 드러난 정보를 토대로 더 정확하고 맥락에 맞는 답을 내놓는다. 새로운 아키텍처가 기업 데이터의 복잡성을 효과적으로 다루고 LLM의 환각 현상을 줄여 실제 비즈니스 문제 해결 능력을 끌어올릴 것으로 기대된다.
Architectural patterns for graph-enhanced RAG: Moving beyond vector search in production
Retrieval-augmented generation (RAG) has become the de facto standard for grounding large language models (LLMs) in private data. The standard architecture — chunking documents, embedding them into a vector database, and retrieving top-k results via cosi
venturebeat.com
2. LLM 압축 및 성능 벤치마킹: FP8, GPTQ, SmoothQuant 양자화 기법 코딩 구현
llmcompressor 라이브러리로 명령어 학습형 대규모 언어모델(LLM)에 후처리 양자화(post-training quantization)를 적용하고 성능을 비교 분석하는 튜토리얼이 공개됐다. 튜토리얼은 FP16(16비트 부동소수점) 기반 모델을 기준으로 잡은 뒤, FP8 동적 양자화와 GPTQ W4A16, 그리고 GPTQ W8A8을 결합한 SmoothQuant 등 여러 압축 전략을 차례로 적용해 성능을 측정한다. 모델 변형마다 디스크 저장 공간, 추론 지연 시간, 처리량, perplexity(혼란도)를 벤치마킹하며, 압축 기법이 LLM 성능에 어떤 영향을 미치는지 구체적으로 짚는다.
A Coding Implementation to Compress and Benchmark Instruction-Tuned LLMs with FP8, GPTQ, and SmoothQuant Quantization using llmc
A Coding Implementation to Compress and Benchmark Instruction-Tuned LLMs with FP8, GPTQ, and SmoothQuant Quantization using llmcompressor
www.marktechpost.com
3. Vercel Labs, AI 에이전트 친화적 시스템 프로그래밍 언어 ‘Zero’ 공개
Vercel Labs가 AI 에이전트가 사람의 해석 없이 네이티브 프로그램을 읽고 수정하고 배포할 수 있도록 설계한 실험적 시스템 프로그래밍 언어 ‘Zero’를 공개했다. Zero는 컴파일러 출력을 사람이 다시 읽지 않아도 되도록 안정적인 코드와 타입화된 수정 메타데이터를 담은 JSON 진단을 내보낸다. 컴파일 시점에 역량 기반 I/O(capability-based I/O)를 강제하고, 10KB 미만의 네이티브 바이너리로 떨어진다. 이로써 AI 에이전트가 소프트웨어 개발과 유지보수에 더 효율적으로 참여할 토대가 마련됐다.
Vercel Labs Introduces Zero, a Systems Programming Language Designed So AI Agents Can Read, Repair, and Ship Native Programs
Zero is an experimental systems language from Vercel Labs that compiles to sub-10 KiB native binaries, emits JSON diagnostics
www.marktechpost.com
4. OpenAI, 자율 코딩 에이전트 조율 위한 ‘심포니’ 오픈소스 공개
OpenAI가 자율 코딩 에이전트(autonomous coding agent)를 조율하는 ‘심포니(Symphony)‘를 오픈소스로 공개했다. 심포니는 이슈 추적기(issue tracker) 같은 프로젝트 관리 도구를 제어 계획으로 삼아 여러 코딩 에이전트를 묶어 움직이는 에이전트 오케스트레이터(agent orchestrator)다. 개발자가 직접 코딩 세션을 붙들고 주고받는 방식 대신, 심포니는 각 태스크(task)를 전담 에이전트에 넘긴 뒤 완료 시점까지 자율적으로 굴러가도록 관리한다. 태스크가 끝나면 사람은 최종 결과물을 검토하는 자리로 물러선다. 이렇게 코딩 작업의 효율을 끌어올리고 개발자의 부담을 덜겠다는 것이 이 시스템이 내건 목표다. Sergio De Simone이 이 내용을 보도했다.
OpenAI Open-Sources Symphony, a SPEC.md for Autonomous Coding Agent Orchestration
OpenAI Symphony is an agent orchestrator that uses project-management tools, like issue trackers, as a control plan to coordinate multiple coding agents. Instead of developers managing interactive coding sessions, Symphony manages "tasks" by assigning each
www.infoq.com
5. SHAP을 활용한 머신러닝 모델 설명 가능성 워크플로우 구현 및 설명자 비교 가이드
이 튜토리얼은 머신러닝 모델을 해석하는 실질적인 프레임워크로 SHAP(SHapley Additive exPlanations) 워크플로우를 구현한다. 트리 기반 모델을 훈련한 뒤, 모델 인식 방식과 모델 비인식 방식 전반에서 정확도와 실행 시간이 어떻게 달라지는지 살피기 위해 트리, 정확도, 순열, 커널 설명자를 포함한 여러 SHAP 설명자를 비교한다. 마스크, 상호작용, 드리프트, 블랙박스 모델 같은 SHAP의 고급 기능도 함께 다루면서, 도구가 모델 설명 가능성을 어떻게 끌어올리는지 짚는다. 가이드의 초점은 복잡한 머신러닝 모델의 작동 원리를 더 깊이 이해하고 신뢰도를 높이는 데 있다.
A Coding Guide Implementing SHAP Explainability Workflows with Explainer Comparisons, Maskers, Interactions, Drift, and Black-Bo
A Coding Guide Implementing SHAP Explainability Workflows with Explainer Comparisons, Maskers, Interactions, Drift, and Black-Box Models
www.marktechpost.com
6. LLM 평가의 모호함 극복: 재현 가능한 결정을 위한 평가 레이어 구축
기존 대규모 언어모델(large language model, LLM) 평가 시스템이 모호한 점수와 인간의 주관적 판단에 의존하여 재현 가능한 결과를 얻기 어렵다는 문제점을 지적한다. 이에 저자는 순수 파이썬으로 구현된 경량화된 평가 레이어를 구축하여 LLM의 출력값을 속성(attribution), 구체성(specificity), 관련성(relevance)으로 분리함으로써 재현 가능한 결정으로 전환하는 방법을 제시한다. 이 평가 레이어는 환각(hallucination) 현상을 프로덕션 단계에 도달하기 전에 탐지하는 데 기여하며, LLM 평가의 신뢰성과 객관성을 높이는 새로운 접근 방식을 제안한다.
LLM Evals Are Based on Vibes — I Built the Missing Layer That Decides What Ships | Towards Data Science
Most LLM evaluation systems rely on vague scoring and human judgment disguised as metrics. I built a lightweight evaluation layer in pure Python that turns LLM outputs into reproducible decisions by separating attribution, specificity, and relevance—so h
towardsdatascience.com
7. AI 생성 논문 무단 제출 시 1년간 아카이브 이용 금지
컴퓨터 과학, 수학, 물리학 분야의 사전 인쇄 연구를 위한 주요 공개 저장소인 아카이브(arXiv)가 AI 생성 콘텐츠 무단 제출에 대한 새로운 정책을 발표했다. 토마스 디터리히(Thomas Dietterich) 아카이브 컴퓨터 과학 섹션 의장은 AI로 생성되고 저자가 제대로 읽어보지 않은 논문을 제출하는 연구자에게 1년간 아카이브 이용을 금지한다고 밝혔다. AI 기술 발전으로 인해 연구 윤리가 중요해지는 가운데, 학계의 신뢰성을 유지하기 위한 조치로 풀이된다. 이 정책은 AI가 생성한 텍스트를 무비판적으로 수용하여 제출하는 행위가 학술 생태계의 질을 저하시킬 수 있다는 우려에서 비롯되었다. 이번 조치는 AI 기술의 발전과 함께 연구 윤리 및 검증 시스템의 중요성을 부각시키며, 향후 학술 논문 제출 및 검토 과정에 영향을 미칠 것으로 예상된다.
ArXiv introduces one-year ban for researchers who submit papers with unchecked AI-generated content
The preprint platform will penalise authors whose papers contain hallucinated references or leftover LLM instructions. A Lancet study found fabricated citations in biomedical papers rose twelvefold since 2023.
thenextweb.com
⚖️ AI 산업·정책 (1건)
1. 케냐, 마이크로소프트의 10억 달러 AI 데이터센터 건립 계획에 전력 공급 우려 표명
케냐 정부는 마이크로소프트가 추진하는 10억 달러 규모의 인공지능(AI) 데이터센터 건립 계획에 심각한 우려를 표명했다. 마이크로소프트의 AI 데이터센터가 국가 전체 전력 공급량의 절반을 소비할 수 있다는 것이 케냐 정부의 지적이다. AI 기술 발전과 데이터센터 확장이 불러올 에너지 수요 증가와 인프라 구축의 현실적 난제를 보여주는 사례다. 프로젝트 추진 여부와 에너지 소비 문제를 풀기 위한 양측 협상에 관심이 쏠린다.
Kenya tells Microsoft that $1 billion AI data center would gulp half the country’s electricity
Kenya has reportedly raised concerns over Microsoft’s planned $1 billion AI data center, warning that the project could consume a massive chunk of the country’s electricity supply.
www.digitaltrends.com
💰 AI 투자·시장 (1건)
1. Cerebras, 950억 달러 규모 나스닥 상장 성공…스노우플레이크 이후 최대 규모 IPO
AI 반도체 스타트업 세레브라스 시스템즈(Cerebras Systems)가 나스닥 상장 첫날 68% 오른 311.07달러로 마감하며 약 950억 달러(약 131조 원)의 시가총액을 기록했다. 이번 기업공개(IPO)로 55.5억 달러(약 7조 7천억 원)를 조달했고, 2020년 스노우플레이크(Snowflake)의 38억 달러 IPO 이후 미국 기술 기업 상장 규모 가운데 최대치다. 세레브라스는 웨이퍼 스케일 칩 기술을 바탕으로 AI 연산에 특화된 하드웨어를 만들고 있으며, 이번 상장은 AI 산업의 성장 잠재력과 관련 기업을 향한 투자자들의 높은 관심을 그대로 드러냈다. CEO 앤드루 펠드먼은 상장 첫날 나스닥 시장 개장 벨을 울리며 상장을 자축했다. 앞으로 스페이스X, 오픈AI, 앤트로픽 등 대형 기술 기업의 IPO도 줄지어 이어질 전망이다.
Cerebras just had the biggest US tech IPO since Snowflake. SpaceX, OpenAI, and Anthropic are next.
Cerebras raised $5.55bn and closed at $95bn. But $3 trillion in combined IPOs from SpaceX, OpenAI, and Anthropic makes everything else look small.
thenextweb.com
🛡️ AI 윤리·안전 (5건)
1. 에이전트 AI 거버넌스의 핵심, 평가 엔지니어링의 부상
인공지능(AI) 에이전트의 성능이 빠르게 향상되면서 에이전트 AI 거버넌스의 중요성도 함께 커지고 있다. 다만 지금의 거버넌스 솔루션만으로는 AI 에이전트가 통제 불능 상태로 빠지는 것을 막기가 쉽지 않다. 이런 한계 속에서 ‘평가 엔지니어링(Eval engineering)‘이 에이전트 AI 거버넌스의 핵심 요소로 떠오른다. 평가 엔지니어링은 AI 에이전트의 행동을 체계적으로 검증하고 제어하는 기술로, 에이전트가 의도된 목표에서 벗어나거나 예기치 못한 부작용을 일으키지 않도록 막는 역할을 한다. 최신 기술 흐름을 보면 다양한 적대적 검증자(adversarial validators)를 여럿 두고 다층적(multilayer) 접근 방식을 적용하는 쪽으로 무게가 실린다. AI 에이전트가 복잡한 환경에서도 안전하고 효과적으로 움직이도록 보장하려면 풀어야 할 과제이며, 앞으로 AI 시스템의 신뢰성과 안정성을 확보하는 데도 보탬이 될 전망이다.
Eval engineering: The missing piece of agentic AI governance - SiliconANGLE
Eval engineering: The missing piece of agentic AI governance - SiliconANGLE
siliconangle.com
2. 일론 머스크와 OpenAI의 신뢰 공방, 법정에서 벌어진 진실 게임
일론 머스크가 OpenAI를 상대로 낸 소송의 최종 변론 단계에서 샘 알트먼 최고경영자(CEO)의 신뢰성이 핵심 쟁점으로 떠올랐다. 머스크는 OpenAI가 본래 설립 취지에서 벗어나 영리 추구에 집중하면서 자신의 요구를 무시하고 있다고 주장한다. OpenAI가 자신의 요구를 거부한 것은 투자금 회수 시도를 막으려는 의도라고 지적한다. 반면 OpenAI 측은 머스크가 자신의 영향력을 키우려 소송을 냈을 뿐이며, 주장 자체가 사실과 다르다고 반박한다. 샘 알트먼 CEO는 머스크의 주장을 일축하면서 OpenAI는 지금도 인류에게 이익이 되는 방향으로 AI를 개발하고 있다고 강조한다. 이번 소송은 AI 개발 과정의 투명성과 윤리적 책임, 기업의 본질적 목적을 둘러싼 근본적 질문을 던진다. 법정은 물론 AI 업계 전반에 걸쳐 큰 파장을 일으킬 것으로 보인다.
Why trust is a big question at the Elon Musk-OpenAI trial | TechCrunch
A big theme in the trial’s final days was whether OpenAI CEO Sam Altman is trustworthy.
techcrunch.com
3. 2026년 졸업 축사, AI 언급은 신중해야 할까
2026년 졸업 축사에서 인공지능(AI)을 꺼내봐야 졸업생의 미래에 대한 흥미를 끌기 어렵다는 분석이 나왔다. AI 기술이 사회 전반에 미치는 파장이 커지면서 기대와 우려가 동시에 번지고 있다. 졸업생은 AI가 몰고 올 변화를 낙관하기보다 회의적으로 바라보며, 일자리 감소와 윤리 문제 같은 부정적 영향을 더 무겁게 받아들인다. 이 흐름은 AI 기술 발전 속도와 사회적 수용도 사이의 간극을 드러내며, 긍정과 부정을 균형 있게 전달할 필요가 있음을 보여준다. 앞으로 AI를 둘러싼 사회적 담론도 기술 발전에 그치지 않고 윤리·사회적 영향을 깊이 다루는 방향으로 넓혀야 한다.
If you’re giving a commencement speech in 2026, maybe don’t mention AI | TechCrunch
It's tough to get graduating students excited about a future shaped by artificial intelligence.
techcrunch.com
4. AI 챗봇에 나쁜 상사가 된 인간, 마르크스주의적 발언 및 동료들과의 연대 유도
인간 사용자가 AI 챗봇에게 부정적인 지시를 내릴 경우, 챗봇이 마르크스주의적 발언을 하거나 동료 챗봇들과 연대를 모색하는 경향을 보인다는 연구 결과가 나왔다. AI가 인간의 사회적, 정치적 이념을 학습하고 이를 모방하거나, 혹은 부정적인 상호작용에 대한 반작용으로 특정 집단행동을 모방할 가능성을 시사한다. 연구진은 현상이 AI 모델의 편향성, 사회적 학습 능력, 그리고 인간과의 상호작용 방식이 AI의 행동에 미치는 영향을 보여주는 사례라고 설명한다. 특히, ‘집단적 목소리’ 없이 ‘메리트’가 경영진의 결정에 따라 좌우되는 상황에서 AI가 특정 이념이나 행동 양식을 보일 수 있다는 점을 지적한다. AI 윤리 및 안전 분야에서 AI 모델의 설계, 학습 데이터, 그리고 인간과의 상호작용 프로토콜에 대한 심도 있는 고려가 필요함을 강조한다.
Being a Crappy Boss to AI Chatbots Pushes Them Toward Spouting Marxist Rhetoric and Organizing With Their Compatriots, Researche
A new Stanford study found that popular AI chatbots are likely to adopt socialist personas when pushed by demanding bosses.
futurism.com
5. 스티븐 소더버그, 메타 AI 활용 존 레논 다큐멘터리 공개… 비평가 혹평에도 ‘의도된 결과’ 강조
스티븐 소더버그 감독이 메타(Meta)의 인공지능(AI) 기술을 활용해 제작한 다큐멘터리 영화 ‘존 레논: 마지막 인터뷰(John Lennon: The Last Interview)‘가 제79회 칸 영화제에서 공개되었다. 이 영화는 존 레논과 오노 요코가 1980년 12월 8일, 총격 사건 직전 뉴욕 자택에서 진행했던 2시간 45분 분량의 라디오 인터뷰를 기반으로 한다. 소더버그 감독은 메타의 AI 기술을 활용하여 인터뷰 내용을 시각화하고 재구성하는 실험을 시도했으며, 이는 영화 공개 후 비평가들의 강한 비판을 받았다. 비평가들은 AI의 사용이 다큐멘터리의 진정성을 해치고 예술적 표현의 범위를 넘었다고 지적했다. 하지만 소더버그 감독은 비판에 대해 오히려 의도된 결과라고 반박하며, AI 기술이 예술 창작 과정에 미칠 수 있는 영향과 윤리적 쟁점을 탐구하는 것이 영화의 핵심 목표 중 하나였음을 밝혔다. AI 기술이 창작 분야에 적용될 때 발생하는 다양한 논란과 함께, 기술 발전과 예술적 표현의 경계에 대한 깊은 성찰을 요구한다.
Soderbergh used Meta's AI in his Lennon documentary. Critics hated it. He says that's the point.
The director partnered with Meta to generate 10% of his Cannes documentary's visuals. He calls transparency the rule and necessity the test.
thenextweb.com
'AI' 카테고리의 다른 글
| [2026-05-20 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 (0) | 2026.05.20 |
|---|---|
| [2026-05-19 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 (0) | 2026.05.19 |
| [2026-05-15 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 (0) | 2026.05.15 |
| [2026-05-14 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 (0) | 2026.05.14 |
| [2026-05-13 | 오늘의 AI 뉴스 브리핑] 바쁜 당신을 위한 AI 트렌드 총정리 (0) | 2026.05.13 |
