데이터샤우츠

[2026-04-15 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 본문

논문(AI,DATA)

[2026-04-15 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향

gibdata 2026. 4. 15. 10:18
반응형

📖 Electronic Markets - 1건

LLM-as-a-Judge for mental support: A meta-evaluation using domain-specific platform data

대규모 언어모델(large language model, LLM)을 평가자로 활용하는 'LLM-as-a-Judge' 방식은 정신 건강 지원 분야에서 인간 평가자의 대안으로 주목받고 있다. 그런데 모델이 자신이 생성한 답변을 과도하게 선호하는 강력한 자기 강화 편향(self-enhancement bias)을 드러냈다. 연구팀은 중국 정신 건강 플랫폼의 실제 사용자 데이터를 활용해 인간 평가자와 LLM 평가자의 일치도를 분석했다. 인간 대 인간 답변 비교에서는 72~84%의 일치도를 보였다. LLM이 포함된 비교군에서는 일치도가 최대 26%까지 급락했다. 단순히 모델을 교체해도 편향은 줄어들지 않았다. 정신 건강 서비스의 자동화 평가를 전적으로 LLM에 의존하는 것은 위험하다. 아직 인간의 검수와 개입이 필수적이다.

바로가기

📖 EPJ Data Science - 3건

Large scale statistically validated comorbidity networks

연구진은 핀란드 서남부 보건 구역의 전자 건강 기록(electronic health records, EHR) 데이터를 분석해 연령·성별 기반의 대규모 질병 동반질환 네트워크(comorbidity network)를 구축했다. 국제질병분류(international classification of diseases, ICD) 코드로 질병 간 통계적 유의성을 검증한 뒤 질병 군집을 계층적 구조로 시각화했다. 연령·성별 집단마다 특정 질병 범주가 과다하게 나타나는 독특한 군집 구조가 확인됐다. 군집은 계층적 나무 구조로 통합할 수 있었다. 연구팀은 특정 질병 범주가 네트워크 결합도에 미치는 영향을 파악하는 해체 절차를 통해 동반질환의 핵심 연결 고리를 규명했다. 질병 간 연관성을 데이터 기반으로 정량화하고 계층적 구조로 분류한 이번 연구는 개인 맞춤형 의료 전략 수립과 질병 예방을 위한 분석 틀로 활용 가능하다.

바로가기

From keyword-based text measures to latent variables: confirmatory factor analysis with word embeddings

단어 임베딩(word embedding)의 의미적 관계를 확인적 요인 분석(confirmatory factor analysis, CFA)과 결합해 텍스트 데이터의 잠재 변수를 정밀하게 측정하는 방법론이 제시됐다. 기존 사전 기반 텍스트 분석은 신뢰도·타당성 검증이 취약했다. 이 연구는 단어 벡터 간 중심 코사인 유사도(centered cosine similarity)를 CFA 입력 행렬로 활용해 모델 적합도 지수 산출과 측정 불변성 검증을 구현했다. 러시아의 우크라이나 침공 당시 전쟁 불안 담론 분석으로 실증적 유효성도 입증했다. 라반(lavaan) 등 표준 통계 소프트웨어로 구현 가능해 사회과학 연구의 데이터 분석 신뢰도를 높일 것으로 평가된다.

바로가기

A row-type specific hybrid framework for credit risk analysis: loan portfolio based feature selection and unsupervised Bayesian network dependency exploration

신용 위험 분석 프레임워크 크랩넷(Credit Risk Analysis with Bayesian Networks, CRAB-Net)은 대출 유형별로 데이터를 분할하고 베이시안 네트워크(Bayesian network)로 변수 간 조건부 의존성을 파악한다. 대출 종류에 따라 위험 요소가 다르게 작용한다는 점에 착안해 설계됐다. 개인 대출에서는 할부 빈도와 연체 상태 같은 상환 관련 변수가 위험의 핵심 노드로 나타났다. 농업 대출에서는 토지 정보와 정부 보조금, 담보 유형이 위험 결정의 주요 요인이었다. 기존 머신러닝 모델과 달리 특정 대출군에 최적화된 특징 선택(feature selection)을 수행하고, 비지도 학습으로 데이터의 인과 관계를 시각화한다. 금융 규제인 바젤(Basel) 규범 준수에 필요한 투명성과 해석 가능성을 높여 학술적 가치가 크다.

바로가기

📖 Journal of Big Data - 1건

Visual big data mining: toward next-generation multi-label image annotation and retrieval using Quantum Firefly optimization

양자 강화 반딧불이 알고리즘(Quantum-Enhanced Firefly Algorithm, QFA)을 활용해 다중 레이블 이미지 주석의 정확도를 크게 높였다. 기존 반딧불이 알고리즘(Firefly Algorithm, FA)의 조기 수렴·지역 최적해 문제를 극복하고자 양자 기반 확률적 탐색 방식을 도입했다. 이미지를 의미 있는 영역으로 분할한 뒤 색상과 형태 정보를 12차원 특징 벡터로 추출한다. 추출한 벡터는 베이지안(Bayesian) 분류를 거쳐 레이블로 변환된다. 코렐(Corel) 데이터셋 실험에서 F1 점수 0.80, 평균 정밀도(mean Average Precision, mAP) 0.84를 기록하며 기존 방식보다 높은 성능을 입증했다. 영역 단위 정교한 주석 처리로 복잡한 시각 데이터 마이닝의 효율성과 신뢰성을 확보할 수 있다.

바로가기

📖 Scientific Data - 5건

High-Resolution dataset on elderly care facility accessibility and inequality in 21 Chinese cities (2020)

연구진은 2020년 기준 중국 21개 주요 도시의 노인 요양 시설 접근성과 공간적 불평등을 정밀 분석한 고해상도 데이터셋을 구축했다. 가우스 이단계 유동 집계 구역(Gaussian Two-Step Floating Catchment Area, Ga2SFCA) 모델로 시설 공급량, 노인 인구 수요, 도로망 기반 이동 거리를 통합 산출하고, 지니 계수(Gini coefficient)로 지역별 불평등도를 측정했다. 분석 결과 모든 도시에서 도심 접근성이 높고 외곽으로 갈수록 낮아지는 중심-주변부 격차 구조가 뚜렷하게 나타났다. 상용 지도 서비스 응용 프로그램 인터페이스(application programming interface, API)와 비교한 결정 계수는 0.94 이상으로 신뢰성을 입증했다. 이 데이터셋은 도시 계획 수립과 보건 정책의 형평성 개선을 위한 기초 자료로 활용될 수 있다.

바로가기

A chromosome-scale nuclear genome and complete mitogenome of the bio-control fungus Cordyceps cateniannulata

연구팀은 해충 방제와 식물 성장에 활용되는 곰팡이인 코르디셉스 카테이아눌라타(Cordyceps cateniannulata)의 고품질 유전체 지도를 완성했다. 유전자 서열 분석 플랫폼인 비지아이(BGI), 팩바이오(PacBio), 하이-씨(Hi-C)를 결합해 핵 유전체 32.71Mb를 7개의 염색체 수준으로 조립했으며 미토콘드리아 유전체와 리보솜 디엔에이(DNA) 반복 서열을 최초로 확보했다. 분석 결과 1만 744개의 단백질 코딩 유전자와 156개의 비코딩 알엔에이(RNA)를 식별했다. 이번 성과는 해당 균류의 유전적 자원 활용도를 높이고 병원성 곰팡이의 진화 경로와 감염 전략을 파악하는 핵심 기초 자료로 쓰인다.

바로가기

A 30 m winter wheat distribution dataset for the North China Plain from 2000 to 2024

연구팀은 중국 화북평원(North China Plain, NCP)의 2000년부터 2024년까지 겨울밀 재배 면적을 30m 해상도로 시각화한 데이터셋 위트맵엔씨피(WheatMapNCP)를 구축했다. 위성 데이터 기반의 자동화된 훈련 표본 생성 방식과 랜덤 포레스트(random forest, RF) 분류기를 결합해 높은 정확도를 확보했다. 검증 결과 전체 정확도(overall accuracy, OA) 95.98%, F1 점수 86.4%를 기록했다. 정부 공식 통계와도 매우 높은 상관관계를 보였다. 연구팀은 식량 안보의 핵심인 겨울밀의 장기적 역학 변화를 모니터링하고 재배 면적을 투명하게 추정할 수 있는 신뢰성 높은 방법론을 제시했다.

바로가기

A Multiple Sclerosis MRI Dataset with Tri-Mask Annotations for Lesion Segmentation

연구진은 다발성 경화증(multiple sclerosis, MS) 병변을 정밀하게 구분하는 새 데이터셋 MS3SEG를 공개했다. 기존 데이터셋은 뇌실 주변의 양성 고신호 병변과 실제 질환성 병변을 구별하기 어렵다는 한계가 있었다. 연구진은 이란 환자 100명의 1.5테슬라(Tesla) 자기공명영상(MRI) 데이터를 수집했다. 뇌실, 정상 백질 고신호, 비정상 MS 병변으로 분류하는 삼중 마스크(tri-mask) 주석 기법을 적용했다. 유넷(U-Net) 등 딥러닝 모델로 검증한 결과, 데이터셋은 임상적으로 중요한 병변 판별 정확도를 높이는 데 기여했다. 실제 임상 환경의 다양성을 반영한 고품질 데이터로 인공지능 기반 자동 진단 알고리즘의 성능과 견고성을 개선했다.

바로가기

The chromosome-level genome assembly of Sitobion avenae Fabricius (Hemiptera: Aphididae)

연구팀은 곡물 해충인 보리진딧물(Sitobion avenae)의 염색체 수준 유전체 지도를 완성했다. 팩바이오(PacBio) 장형 염기서열 분석, 일루미나(Illumina) 단편 염기서열 분석, 하이-씨(Hi-C) 스캐폴딩을 조합해 421메가베이스(Mb) 규모의 유전체를 조립했다. 전체 염기서열의 99.97%가 9개의 가상 염색체에 배치됐으며, 15,369개의 단백질 코딩 유전자가 확인됐다. 이번에 확보한 고품질 유전체 정보는 보리진딧물의 숙주 적응 기제와 해충 방제 전략 연구의 기초 자료로 활용된다.

바로가기

📖 Complex & Intelligent Systems - 1건

Energy constrained and structure sensitivity guided pruning algorithm for aerial object detection networks

연구팀은 무인항공기(UAV) 플랫폼의 제한된 전력 환경에서 객체 탐지 성능을 높이는 에너지 제약 및 구조적 민감도 기반 가지치기 알고리즘(energy constrained and structure sensitivity guided pruning algorithm, ECSSG)을 개발했다. 이 알고리즘은 네트워크의 에너지 소비를 정밀하게 모델링해 직접적인 최적화 목표로 설정하고, 구조적 민감도로 각 계층의 가지치기 비율을 적응적으로 결정한다. 비즈드론(VisDrone), 심드(SIMD), 카프크(CARPK) 데이터셋 실험에서 기존 방식보다 낮은 에너지 예산으로도 높은 탐지 정확도를 유지했다. 복잡한 딥러닝 모델을 전력 효율이 중요한 에지 컴퓨팅 장치에 배포하는 실질적인 해결책을 제시했다는 평가다.

바로가기

📖 CAAI Transactions on Intelligence Technology - 1건

TriCrackNet: Trilateral Segmentation Network for Real‐Time Crack Segmentation

트라이크랙넷(TriCrackNet)은 도로 균열을 실시간으로 정밀하게 분할하기 위해 경계, 공간, 의미 정보를 각각 추출하는 3개 분기 구조를 도입했다. 이 네트워크는 효율적 확장 공간 피라미드 풀링(efficient atrous spatial pyramid pooling, EASPP)으로 중복 계산 없이 다중 스케일 특징을 추출한다. 효율적 특징 강화 모듈(efficient feature enhancement module, EFEM)은 의미론적 안내를 제공하고 노이즈를 억제한다. 효율적 특징 융합 모듈(efficient feature fusion module, EFFM)은 분기 간 특징을 가중치 기반으로 결합한다. 크랙포레스트(CrackForest), 크랙500(Crack500), 딥크랙(DeepCrack) 데이터셋 실험에서 기존 최신 모델 대비 추론 속도와 분할 정확도 양면에서 우수한 균형을 달성했다. 연산 효율성을 유지하면서도 복잡한 도로 균열의 세부 정보를 정확히 포착해 실시간 유지보수 시스템에 적용 가능한 구조임을 입증했다.

바로가기

📖 Journal of Business & Industrial Marketing - 1건

Rethinking employee attraction and retention strategies in tourism and hospitality: insights into workforce ecosystems

연구진은 스웨덴 북부 지역 관광업 관계자 25명을 심층 인터뷰해, 인력 부족의 원인이 낮은 임금·불안정한 근무 환경뿐 아니라 지역 고립과 인프라 부족 등 복합 요인에 있음을 확인했다. 핵심 발견은 기업들이 인재를 두고 단독 경쟁하는 대신, 산업 안팎의 다양한 행위자가 협력하는 이른바 경쟁적 협력(co-opetition)이 유효하다는 것이다. 여러 기업이 인력을 공유해 정규직 고용을 보장하거나, 지역 사회와 연계해 정주 여건을 개선하는 방식이 실제 사례로 제시됐다. 생태계적 접근은 기업의 회복탄력성(resilience)을 높이고 산업 전체의 매력도를 끌어올리는 실질적 대안이라는 점에서 학술적·실무적 의의가 있다.

바로가기

📖 Marketing Intelligence & Planning - 1건

Understanding the influence of marketing and organizational innovation practices on creating firms’ supply chain risk management capabilities

마케팅 혁신(marketing innovation, MI)과 조직 혁신(organizational innovation, OI)은 공급망의 회복 탄력성(resilience)과 견고성(robustness)을 높이고, 공급망 위험 관리 성과(supply chain risk management performance, SCRMP)도 개선한다. 파키스탄 수출 제조업체 267곳을 대상으로 부분 최소 제곱 구조 방정식 모델링(partial least squares structural equation modelling, PLS-SEM)을 적용한 결과다. MI는 회복 탄력성과 견고성을 거쳐 SCRMP에 간접 기여하고, 직접적인 영향도 미쳤다. OI는 두 핵심 역량을 통해서만 성과를 개선하는 완전 매개 효과를 나타냈다. 연구는 기업이 조직·마케팅 방식의 변화로 외부 충격에 대응하는 역동적 역량(dynamic capabilities)을 확보해야 한다고 제안한다.

바로가기

📖 Asia Pacific Journal of Marketing and Logistics - 3건

Performing swift guanxi: relational trust mechanisms in an Indonesian live-streaming commerce context

라이브 커머스 진행자의 공연 전략이 소비자 구매 의도로 이어지는 핵심 기제는 신속 관시(swift guanxi·신속한 관계 형성)와 신뢰 구축이다. 인도네시아 소비자 528명을 대상으로 구조 방정식 모델링을 수행한 결과, 전면·후면 관리, 역할 연기, 상호작용, 극적인 분위기 연출 같은 진행자의 공연 전략은 상호 이해·호혜적 호의·관계 조화라는 세 가지 신속 관시 요소를 강화했다. 강화된 신속 관시는 신뢰와 구매 의도로 이어졌다. 제품 관여도에 따라 신뢰 형성 경로가 갈렸다. 고관여 제품에서는 인지적 측면인 상호 이해가, 저관여 제품에서는 감성적 측면인 호혜적 호의와 관계 조화가 신뢰 형성에 더 큰 영향을 미쳤다. 연구는 신속 관시가 기존 사회적 실재감(social presence)이나 준사회적 상호작용(parasocial interaction) 이론보다 실시간 쇼핑 환경의 관계적 의무를 더 잘 설명함을 입증했다. 문화적 맥락과 제품 특성에 따른 신뢰 형성의 차이를 규명한 점도 성과다.

바로가기

Seeing is deciding: homepage videos in online travel agencies enhance travel intentions and review engagement

온라인 여행사(Online Travel Agency, OTA) 홈페이지에 정지 이미지 대신 동영상을 배치하면 이용자의 여행 의도가 크게 상승한다. 연구진은 210명을 대상으로 두 차례의 통제 실험과 시선 추적(eye-tracking) 기술을 동원했다. 동영상이 생생하고 몰입감 있는 심상(mental imagery)을 유발해 소비자의 구매 결정을 촉진한다는 사실이 확인됐다. 동영상은 소비자의 정보 처리 방식도 바꾼다. 홈페이지에서 시각적 정보를 충분히 얻은 이용자는 이후 리뷰를 확인할 때 이미지 중심 리뷰보다 텍스트 기반 리뷰에 더 집중하는 경향을 보였다. 동영상이 시각적 즐거움 제공에 그치지 않는다는 의미다. 리뷰의 시각적 정보를 대체하는 인지적 보완재 역할까지 수행한다는 게 연구진의 결론이다. OTA 플랫폼은 홈페이지에 고품질 동영상을 배치하고, 이에 맞춰 상세한 텍스트 리뷰를 전략적으로 노출해야 한다. 사용자 경험을 최적화하고 예약 전환율을 높일 수 있다.

바로가기

From exclusion to engagement: how agent type and message appeal influence donation intentions

사회적 배제(social exclusion)를 경험한 사람은 기부 활동을 통해 자신의 사회적 가치를 회복하려는 경향을 보인다. 4번의 행동 실험 결과, 소외감을 느끼는 이들은 가상 에이전트(virtual agent)보다 사람 에이전트(human agent)의 기부 요청에 더 크게 반응했다. 기부 혜택이 타인에게 돌아간다는 메시지(other-benefit appeal)가 사람 에이전트를 통해 전달될 때 기부 의도가 가장 높았다. 타인과의 관계 회복을 갈망하는 소외 계층은 인간적 상호작용과 이타적 메시지를 접할 때 지각된 사회적 가치(perceived social value)가 높아지는 것으로 분석됐다. 이번 연구는 디지털 환경에서 소외된 소비자의 심리적 결핍을 치유하고 기부를 독려하려면 기술 중심 접근보다 사회적 의미를 담은 인간 중심 소통 전략이 필요하다고 제안한다.

바로가기

📖 Journal of Consumer Behaviour - 1건

Product Dependence or Ideology? Multi-Group SEM Analysis of Green Self-Identity and Consumer Behavior of EV Customers Under Experimental Manipulation

친환경 정체성을 가진 소비자는 정체성을 발현하는 방식에 따라 구매 행동의 강도가 달라진다. 연구진은 전기차(electric vehicle, EV) 소유자 556명을 대상으로 실험과 다집단 구조방정식 모델링(multi-group structural equation modeling, MG-SEM)을 수행했다. 그 결과, 특정 친환경 제품을 구매·사용하는 '제품 의존적 정체성' 소비자는 일반적인 친환경 가치를 추구하는 '이념 기반 정체성' 소비자보다 브랜드 충성도와 구매 의도가 훨씬 높았다. 제품 의존적 소비자에게는 브랜드 충성도가 친환경 정체성과 구매 의도를 잇는 결정적 매개체로 작용했다. 친환경 소비는 단순한 가치관의 영역이 아니다. 구체적인 제품을 통한 자기표현이 동반될 때 실질적인 구매 행동으로 강하게 이어진다.

바로가기

📖 Scientometrics - 1건

National contexts and gendered research performance: a study of Armenia and Italy

아르메니아와 이탈리아의 과학기술 분야 연구자 3만여 명을 비교 분석했더니, 양국 모두 성별에 따른 연구 성과 격차가 뚜렷하게 나타났다. 연구팀은 과학기술(STEMM) 분야 종사자를 대상으로 출판물 수, 인용 영향력, 협업 패턴을 측정했다. 아르메니아는 여성 연구자 비중이 높음에도 상위 직급으로 갈수록 여성 비율이 급감하는 수직적 분리가 심각했다. 이탈리아는 연구 인프라가 성숙했음에도 주요 직책의 성별 불균형과 국제 협업 참여에서 남성 우위 현상이 지속됐다. 두 나라 여성 연구자들은 내부 기관이나 국내 협업에는 적극적이면서도 국제 연구 네트워크에서는 소외되는 경향이 공통적으로 확인됐다. 연구팀은 국가별 연구 시스템의 구조적 차이가 성별 격차를 고착화한다는 점을 규명했다. 성평등 정책이 수치적 대표성 확대에 머물지 않고 연구 환경의 구조적 장벽 해소로 이어져야 한다는 게 연구팀의 결론이다.

바로가기

📖 Industrial Management & Data Systems - 1건

Reconceptualizing digital culture as a higher-order capability for digital transformation: insights from innovation ecosystem actors

디지털 문화는 기술 도입에 그치지 않는다. 조직의 혁신 과정을 주도하고 재구성하는 고차원적 역량(higher-order capability)으로 기능한다. 연구진은 체계적 문헌 검토와 브라질 혁신 생태계 관계자 33명 심층 인터뷰를 바탕으로 이를 규명했다. 디지털 문화는 기술적 도구 활용에 머물지 않고 공동의 가치와 윤리적 태도, 리더십 변화를 포괄하는 시스템이다. 조직이 변화를 감지하고(sensing), 기회를 포착하며(seizing), 자원을 재배치(reconfiguring)하는 동적 역량의 핵심 기반이기도 하다. 이번 연구는 디지털 전환이 단기적인 기술 도입만으로는 성공할 수 없음을 입증했다. 조직 구성원의 마인드셋과 협력적 문화 구축이 지속 가능한 혁신의 필수 조건이라는 결론이다.

바로가기

반응형