데이터샤우츠

[2026-04-29 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 본문

논문(AI,DATA)

[2026-04-29 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향

gibdata 2026. 4. 29. 20:22
반응형

📖 Electronic Markets - 1건

Beyond markets and hierarchies: How GenAI enables unbounded cognitive fusion

생성형 인공지능(generative artificial intelligence, GenAI)이 인간의 인지적 제약을 완화하면서 시장과 위계라는 기존 조직 이론의 근간을 흔들고 있다. 연구진은 인지 자원이 희소하다는 과거 가정에서 벗어나 인지적 풍요에 바탕을 둔 새 이론인 무경계 인지 융합(unbounded cognitive fusion, UCF)을 제시했다. UCF는 권한이나 가격 신호가 아닌 인간과 AI의 유동적 결합으로 협력을 달성하며, 이를 구현하는 세 가지 조직 형태로 인지 메쉬워크(cognitive meshwork), 알고리즘 생태계(algorithmic ecosystem), 하이브리드 지능 집단(hybrid intelligence collective)을 정의했다. 연구진은 AI가 도구에 그치지 않고 인지적 주체로 참여하는 조직 환경에서 기존 경영 이론이 한계에 부딪혔다고 짚으면서 조직 설계의 새 패러다임을 제안했다. 학술적으로 의의가 큰 작업으로 평가된다.

바로가기

📖 Scientific Data - 5건

National 10-m soybean maps for South Africa from 2018 to 2025

연구진은 남아프리카공화국의 2018년부터 2025년까지 대두 재배 현황을 10미터 해상도로 정밀하게 담아낸 데이터셋 소이SA10(SoySA10)을 구축했다. 센티넬-2(Sentinel-2) 위성 시계열 자료에 무작위 숲(random forest) 알고리즘과 동적 시간 워핑(dynamic time warping)을 결합한 분류 모델을 적용했다. 그 결과 전체 정확도 0.89를 기록했고, 실제 농작물 생산 통계와도 일관된 수치가 확인됐다. 해당 데이터셋은 대두 재배지 변화를 추적하고 농업 자원을 관리하는 기초 자료로 쓰인다.

바로가기

China’s carbon peaking policy intensity dataset across national, provincial, municipal to county-level over 2021 to 2025

연구진은 2021년부터 2025년까지 중국 전역에서 발표된 탄소 정점(carbon peaking) 이행 계획 316건을 수집해 정책 강도를 수치화했다. 분석에는 자연어 처리(natural language processing, NLP)와 머신러닝(machine learning) 기술을 활용했고, 법적·시장적·감독적 도구와 정책 대상의 구체성 수준을 따졌다. 해당 데이터셋에는 국가와 성, 시, 현 등 다양한 행정 단위의 정책 정보가 담겼다. 이를 토대로 중국의 탄소 중립 정책 체계를 다각도로 파악할 수 있고, 향후 국가별 정책 비교나 효과 평가에 기초 자료로 활용할 수 있다.

바로가기

A Benchmark Dataset for Concealed Improvised Explosive Device Detection in X-ray Security Imaging

연구진은 공항 등 보안 시설에서 사제 폭발물(Improvised Explosive Device, IED)을 자동 탐지하기 위한 공개 데이터셋 아이이디엑스레이(IEDXray)를 구축했다. 해당 데이터셋에는 노트북, 휴대전화, 호출기 등 일상적인 기기에 숨겨진 폭발물과 복잡하게 얽힌 수하물 환경을 포함한 17,360장의 엑스레이(X-ray) 영상이 담겼다. 칼리파 과학기술대(Khalifa University of Science and Technology) 연구팀은 욜로브이텐(YOLOv10), 패스터 알-씨엔엔(Faster R-CNN), 디테르(DETR), 그라운딩디노(GroundingDINO) 등 최신 탐지 모델로 데이터셋 성능을 검증하며 기준점을 제시했다. 그 결과 실제 보안 검색 환경의 변수와 복잡성을 반영한 고품질 데이터를 확보하면서, 인공지능 기반 폭발물 탐지 기술 발전을 앞당길 토대가 마련됐다.

바로가기

City-level carbon emissions data in Southeast Asia from 2000 to 2020

싱가포르 국립대 연구진이 2000년부터 2020년까지 동남아시아 11개국 4,413개 행정구역의 연간 이산화탄소(CO₂) 배출량 데이터를 구축했다. 연구팀은 기존 국가·광역 단위 배출량 자료인 에드가(Emissions Database for Global Atmospheric Research, EDGAR)에 야간 조명, 불투과 면적, 도시·농촌 정주 분포 데이터를 결합해 배출량을 세분화했다. 지역별 편차를 보정하고자 그래디언트 부스팅(gradient boosting) 알고리즘 기반의 적응형 이중 모델 전략을 택했다. 이어 예측값의 합이 전체 배출량과 맞아떨어지도록 질량 균형 제약을 적용해 정확도를 끌어올렸다. 이번 성과는 동남아시아 도시의 배출원 파악과 기후 정책 수립을 뒷받침할 기초 자료로 쓰임새가 크다.

바로가기

The chromosome-level genome assembly and annotation of Parabotia bimaculata (Cypriniformes: Cobitidae: Botiinae)

연구진은 중국 남서부 특산종인 파라보티아 비마쿨라타(Parabotia bimaculata)의 염색체 수준 유전체 지도를 처음으로 완성했다. 610.59Mb(메가베이스) 규모의 유전체 정보를 하이-씨(Hi-C) 기술로 25개의 가상 염색체에 배치했고, 그 결과 98.54%에 이르는 유전자 완성도를 확보했다. 상동성 기반 예측과 리보핵산 염기서열 분석(RNA-sequencing)을 함께 적용해 2만 6,312개의 단백질 코딩 유전자를 찾아냈으며, 그중 90.58%의 기능을 규명했다. 해당 유전체 자원은 앞으로 이 종의 진화 생물학 연구와 보전 전략 수립에 핵심 기초 자료로 쓰인다.

바로가기

📖 Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery - 1건

Large Language Models for Explainable Medical Text Summarization: A Systematic Literature Review

연구진은 대규모 언어모델(large language model, LLM)을 활용한 의료 텍스트 요약과 설명 가능성(explainability) 분야의 연구 61편을 체계적으로 검토했다. 분석 결과를 보면 디코더 전용(decoder-only) 구조가 전체의 60.7%를 차지하며 주류를 이뤘고, 별도 학습 없이 바로 결과를 끌어내는 제로샷(zero-shot) 프롬프팅 방식이 55.7%로 가장 흔하게 쓰였다. 미세 조정(fine-tuning)을 거친 모델은 제로샷 방식보다 ROUGE-1 점수가 38.6% 높았고, 설명 가능한 기능을 갖춘 모델은 의료진의 수용도를 27.3% 끌어올렸다. 다만 연구의 63.9%가 모델의 환각(hallucination) 문제를 지적했고, 실제 임상 현장과의 통합 비율은 14.8%에 그쳤다. 이번 검토에서 의료 분야 LLM의 잠재력이 확인되는 동시에 임상 검증과 시스템 통합, 윤리적 관리라는 과제가 남아 있다는 점이 분명해졌다.

바로가기

📖 Journal of Intelligent Information Systems - 2건

Active learning for LLM-based recommender systems

대규모 언어모델(large language model, LLM) 기반 추천 시스템의 학습 효율을 높이는 능동 학습(active learning) 프레임워크 알렉(ALLRec)이 모델의 학습 속도와 성능을 동시에 끌어올렸다. 연구진은 추론 단계에서 나오는 손실값(loss value)으로 학습 데이터의 정보량을 평가해 핵심 샘플을 골라내는 방식을 택했다. 여기에 메인 모델과 분리된 다양성 학습 모듈을 설계해 데이터 분포 안에서 샘플들의 구조적·의미적 차이를 포착하면서 선별된 데이터의 다양성을 확보했다. 제한된 자원 안에서 가치 있는 샘플을 효과적으로 추려낸 결과, 여러 벤치마크 데이터셋에서 모델 수렴 속도와 추천 정확도가 함께 올라갔다. 고비용의 LLM 학습 과정에서 데이터 활용 효율을 극대화할 실용적 해법으로 평가받는다.

바로가기

Hallucination detection in large language models based on multi-granularity consistency

대규모 언어모델(large language model, LLM)의 환각 현상을 외부 지식 없이 탐지하는 다중 입도 일관성 검증 기법이 개발됐다. 연구진은 정방향 언어 모델링(Forward Language Modeling, FLLM)과 역방향 언어 모델링(Backward Language Modeling, BLLM)을 결합해 여러 후보 답변을 생성한 뒤, 코사인 유사도 분석과 일관성 추정 알고리즘으로 답변의 신뢰도를 판별했다. 글로벌 국가 정보 데이터셋(Global Country Information Dataset 2023)을 대상으로 실험하자, 기존 자연어 추론(Natural Language Inference, NLI) 기반 방식보다 높은 탐지 정밀도와 안정성이 확인됐다. 외부 참조 데이터 없이 모델 자체의 생성 패턴만으로 환각을 식별할 수 있는 기술적 토대를 마련했다는 점에서 학술적 의미가 크다.

바로가기

📖 Journal of Business & Industrial Marketing - 1건

Caring ethical climate and supervisor bottom-line mentality: impact on salesperson unethical behavior, job stress, and turnover intention

영업 관리자의 성과지상주의(bottom-line mentality, BLM)가 영업사원의 비윤리적 행동과 직무 스트레스, 이직 의도를 끌어올린다는 사실이 확인됐다. 찰스 슈웨프커(Charles H. Schwepker Jr)와 메건 굿(Megan C. Good) 연구진은 기업 간 거래(business-to-business, B2B) 영업사원 227명을 대상으로 구조방정식 모형(structural equation modeling)을 적용해 이 같은 결과를 도출했다. 성과지상주의란 다른 우선순위를 외면한 채 결과만 앞세우는 태도로, 사원에게 부정적 영향을 남긴다. 반면 조직 내 배려 중심의 윤리적 기후(caring ethical climate, CEC)가 자리 잡으면 관리자의 성과지상주의가 부르는 악영향을 누그러뜨리는 보호막으로 작동한다. 이번 발견을 통해 기업이 건강한 조직 문화를 가꿔 우수 인력을 붙잡고 윤리적 의사결정을 다질 수 있는 실무적 토대가 마련됐다.

바로가기

📖 Journal of Product and Brand Management - 1건

Connecting across borders: the role of social media influencers in expatriate experiences

해외 거주자들은 사회관계망서비스(social media, SNS) 영향력자(influencer)를 인간 브랜드로 받아들이며, 이들과 상호작용하면서 현지 문화 적응과 고립감 해소에 도움을 얻는다. 연구진은 설문조사를 포함한 3단계 혼합 연구를 진행해 거주자의 영향력자 관여 행동과 심리적 요인을 분석했다. 그 결과 관여도와 정서적 유대감에 따라 거주자를 유사 사회적 탐험가(parasocial explorer), 노련한 탐험가(seasoned explorer), 미식 탐험가(epicurean explorer) 세 유형으로 분류했다. 거주자는 영향력자에게서 문화적 조언과 정서적 지지를 받으면서 새 환경에서 정체성을 형성해 간다. 연구진은 영향력자를 단순 홍보 수단이 아닌 문화적 중재자이자 관계적 인간 브랜드로 규명했고, 그 지점에서 학술적 의미를 지닌다.

바로가기

📖 Artificial Intelligence and Law - 2건

ALTER: a lightweight topic-aware representation legal case retrieval system

알터(ALTER)는 사전 학습된 언어 모델(pretrained language model, PLM)에 토픽 모델링을 결합해 법률 문서 검색 정확도를 끌어올린 시스템이다. 연구진은 토픽 인코더와 텍스트 인코더의 상호작용을 매개하는 공동 주의(co-attention) 계층을 새로 넣었다. 다중 라벨 분류 과제를 함께 학습시켜 텍스트 인코더가 법률 주제 정보를 내재적으로 익히도록 유도했다. 그 결과 검색 단계에서 텍스트 인코더만 가동해도 토픽 정보를 반영한 효율적 추론이 가능해졌다. 성능 검증에서도 강점이 드러났다. 알터는 중국 법률 데이터셋 레카드(LeCaRD)와 영어 데이터셋 콜리(COLIEE)에서 기존 모델을 앞지르며 최고 수준(state-of-the-art)의 점수를 기록했다. 복잡한 법률 문서의 구조적 특성을 반영하면서 경량화된 검색 성능까지 확보한 만큼, 사법 디지털 전환을 앞당길 학술적 가치를 지닌다.

바로가기

AI-driven legal argument strength analyzer & counter-argument generator

연구진은 대규모 언어모델(large language model, LLM)을 활용해 법률 논증의 강도를 분석하고 반박 논리를 생성하는 인공지능 프레임워크를 개발했다. 해당 모델은 지피티-3.5 터보(GPT-3.5 Turbo)를 기반으로 실제 법정 기록과 법률 논의를 학습했고, 검색 증강 생성(retrieval-augmented generation, RAG) 기술을 적용해 사실관계 오류를 줄이면서 법률 문헌에 근거한 답변을 확보했다. 평가에서 인공지능이 생성한 반박 논리는 인간 변호사가 작성한 내용과 0.598의 유사도를 보였다. 상대 측 법률 주장을 무력화하는 효과도 기존보다 6.91% 높게 나타났다. 연구진은 변호사들의 피드백을 반영한 새로운 평가 지표를 도입해 논증의 설득력과 적절성을 검증했고, 그 과정에서 법률 교육과 재판 준비 분야의 자동화된 의사결정을 지원할 기술적 토대를 마련했다.

바로가기

반응형