데이터샤우츠

[2026-04-03 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 본문

논문(AI,DATA)

[2026-04-03 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향

gibdata 2026. 4. 3. 22:51
반응형

📖 Journal of Big Data - 1건

Venue-aware researcher impact assessment using genetic programming

Journal of Big Data에 게재된 "Venue-aware researcher impact assessment using genetic programming" 논문은 과학계량학에서 연구자 평가의 핵심 과제에 주목하였다. 기존의 h-인덱스 등 서지 측정 지표들이 출판 장소의 질을 간과하고 식별 능력이 제한적이라는 문제점을 제기하며, 신뢰할 수 있고 투명하며 맥락에 민감한 평가 방법의 필요성을 강조하였다. 본 연구는 후향적 서지 측정 분석, 출판 장소 인지 모델링, 그리고 유전 프로그래밍(GP) 기반 기호 회귀를 통합한 프레임워크를 제안하였다. 연구 방법론으로는 구글 학술 및 Publish or Perish에서 수집한 컴퓨터 과학 분야 연구자 1,200명(수상자 600명, 비수상자 600명)으로 구성된 균형 잡힌 데이터셋을 활용하였다. 먼저, 64개의 서지 측정 지표를 계산하여 기준선을 설정하였는데, 이 중 h2-upper-인덱스가 수상자의 73%를 식별하며 가장 좋은 성능을 보였다. 다음으로, 저널, 학회, 서적, 특허를 포함하는 출판 장소 인지 데이터셋을 개발하였으며, 신경망으로 추정된 기여도 분석 결과 저널이 84%로 지배적인 요인임을 밝혔다. 마지막으로, 출판 장소 수준의 특징을 통합하는 해석 가능한 폐쇄형 방정식을 도출하기 위해 GP 기반 기호 회귀를 적용하였다. 핵심 발견은 최적의 GP 기반 모델이 수상자의 91%를 식별함으로써, 기존의 후향적 기준선 모델 및 출판 장소 인지 선형 모델의 성능을 능가하면서도 높은 해석 가능성을 유지하였다는 점이다. 이러한 결과는 출판 장소 인지 모델링과 해석 가능한 진화 계산을 결합하는 것이 연구자 평가를 위한 더욱 정확하고 투명하며 공정한 프레임워크를 제공한다는 것을 입증하였다. 이는 학술 기관 및 연구 정책 수립에 실질적인 함의를 가진다.

바로가기

📖 Scientific Data - 3건

A Labrador PeptideAtlas and DIA spectral assay library - resources for proteomics research in dogs

이 연구는 반려견인 개(Canis lupus familiaris)의 단백체 연구 발전을 위한 포괄적인 자원 개발을 목표로 하였다. 특히, 개 단백체 분석에 있어 조직 샘플 분석의 공백과 단백체 및 스펙트럼 분석 라이브러리에 대한 중앙 집중식 자원 부족 문제를 해결하고자 하였다. 연구진은 래브라도 리트리버의 다양한 조직(13가지), 혈장 및 소변 샘플을 활용하여 질량 분석 기반 단백체학 접근 방식을 사용하였다. 연구 방법으로는 데이터 의존형 획득(DDA) 질량 분석을 통해 래브라도 펩타이드아틀라스(Labrador PeptideAtlas)를 구축하였으며, 이는 138회의 MS 실행을 통해 수집된 데이터를 Trans-Proteomic Pipeline으로 처리 및 통계적으로 검증하였다. 또한, 데이터 독립형 획득(DIA) 질량 분석을 사용하여 300회 이상의 MS 주입으로 구성된 포괄적인 스펙트럼 분석 라이브러리를 Spectronaut 소프트웨어로 생성하고 DIALib-QC로 품질을 평가하였다. 주요 결과로 래브라도 펩타이드아틀라스는 예측된 UniProtKB 단백체의 49%(10,264개 단백질)를 포함하며, 1370만 개 이상의 스펙트럼과 6,423개의 정규 단백질을 식별하였다. 스펙트럼 분석 라이브러리는 예측된 개 단백체의 56%(11,792개 단백질)를 식별 및 정량화할 수 있었으며, 다양한 그래디언트 길이(11분, 22분, 45분, 90분)에서 우수한 성능과 높은 정량적 일관성(90분 대비 45분 그래디언트에서 r2=0.991)을 보였다. 또한, 신장 조직에서 정량된 단백질의 기술적 반복 실험에서 낮은 중앙값 변동 계수(CV 7-11%)를 나타냈다. 이러한 결과는 개 단백체 연구를 위한 최초의 포괄적인 지도와 표적 정량 애플리케이션을 위한 스펙트럼 분석 라이브러리를 제공하였으며, 해당 자원들은 공개적으로 이용 가능하여 수의학 연구의 발전에 기여하고 생체지표 발견 및 새로운 연구 결과에 대한 중요한 맥락을 제공하는 토대가 될 것이라는 학술적 의의를 지닌다.

바로가기

Malignant vs. Non-malignant Annotations on TCGA Breast Cancer Whole Slide Images for AI Analysis

이 연구는 유방암 전슬라이드 이미지(WSI)에서 악성 및 비악성 영역을 식별하는 것이 종양 이질성 이해와 조직 병리학적 평가에 필수적이며, 인공지능 모델 학습을 위한 주석 데이터의 중요성을 강조하였다. 연구팀은 TCGA(The Cancer Genome Atlas)에서 50개의 유방암 WSI를 확보하였으며, 전문 병리학자가 QuPath를 사용하여 악성(1,882개) 및 비악성(374개) 영역을 수동으로 주석 처리하였다. 이 주석들은 두 번째 병리학자에 의해 독립적으로 검토되었고, 99.95%의 높은 관찰자 간 일치도를 달성하였다. 또한, 주석의 품질을 평가하기 위해 패치 수준의 악성 대 비악성 분류를 위한 하이브리드 대조 학습-지도 학습 기계 학습 파이프라인을 훈련시켰다. 이 모델은 0.90의 높은 F1-점수를 기록하여, 본 연구에서 제공하는 주석이 공개 데이터셋의 품질과 유사하다는 것을 입증하였다. 이 연구는 유방암 조직 병리학 분야에서 인공지능 모델의 벤치마킹 및 개발을 위한 전문가 수준의 주석을 포함한 독특하고 귀중한 데이터셋을 제공하여 학술적 의의를 지닌다. 이 데이터셋은 유방암 연구 및 진단 보조 기술 발전에 크게 기여할 것으로 기대된다.

바로가기

A cyclist-centric 360° panoramic dataset for safety-critical object detection in real-world cycling scenarios

이 연구는 도시 교통에서 자전거 안전의 중요성이 증가함에도 불구하고 기존 자전거 주행 환경 객체 감지 데이터셋이 가진 한계를 극복하고자 하였다. 기존 데이터셋은 제한적인 장면 다양성, 불완전한 안전 위험 객체 포함, 그리고 실제 자전거 운전자의 시점이 아닌 제한된 시야각으로 인해 사각지대 위험을 제대로 반영하지 못하는 문제점이 있었다. 이러한 한계를 해결하기 위해 연구자들은 복잡한 자전거 주행 시나리오를 위한 새로운 360° 파노라마 데이터셋인 PanoCycle360을 제안하고 구축하였다. 연구 방법론으로 자전거 운전자 헬멧에 장착된 360° 파노라마 카메라를 사용하여 사각지대를 제거하는 완전한 360° 시야를 확보한 데이터를 수집하였다. 이 데이터셋은 10,055장의 파노라마 이미지로 구성되었으며, E-Bike Rider, Person, Car, Van, Bus, Truck, Cyclist, Cargo Tricycle, Auto Rickshaw와 같은 9가지 고위험 클래스에 걸쳐 총 102,171개의 바운딩 박스로 수동 주석이 달렸다. 핵심 발견으로 PanoCycle360 데이터셋은 다양한 매개변수 스케일을 가진 단일 단계, 2단계 및 트랜스포머 기반 객체 감지 프레임워크의 여러 알고리즘에서 그 적용 가능성을 평가한 결과, 여러 시나리오에서 신뢰할 수 있는 평가를 가능하게 한다는 것을 확인하였다. 이 연구는 자전거 운전자 중심의 안전 연구를 발전시키고 전 세계 실제 자전거 주행 시나리오에서 안전에 중요한 객체 감지 시스템을 개발하는 데 중요한 학술적 의의를 가진다. PanoCycle360 데이터셋은 Zenodo를 통해 공개되었고, 기술 검증에 사용된 학습된 모델 가중치와 코드는 GitHub에서 이용 가능하다.

바로가기

📖 AI & Society - 2건

The algorithmic blind spot: bias, moral status, and the future of robot rights

본 연구는 인공지능(AI) 윤리 분야에서 사변적인 미래 로봇 권리 논의에 대한 과도한 관심이 현재 AI 시스템이 초래하는 실질적인 인간 피해, 즉 알고리즘 편향 문제를 간과하는 현상인 '알고리즘 사각지대'를 개념화하고 그 구조적 불균형을 분석하였다. 이 사각지대가 기존 불평등을 은폐하고 책임 회피를 조장하며 책임 메커니즘을 방해하는 방식을 탐구하였다. 연구 방법론으로, 알고리즘 사각지대 개념을 이론적으로 정립한 후, 사변적 AI 도덕적 지위 연구와 경험 기반 알고리즘 편향 완화 연구라는 두 가지 주제 분야에 대한 계량서지학적 분석을 수행하였다. 간행물 수, 연구 자금 지원(보조금 밀도), 정책 문서 연계(정책 통합 비대칭성)를 비교 분석하여 윤리적 담론의 분포와 제도적 반영 사이의 비대칭성을 측정하였다. 핵심 발견은 로봇 권리 논의와 알고리즘 편향 연구 간 출판물 양은 유사했으나, 알고리즘 편향 연구가 로봇 권리 연구에 비해 약 3배 높은 보조금 밀도와 7배 이상 높은 정책 통합 비율을 보였다는 점이다. 이러한 구조적 비대칭성은 여러 해에 걸쳐 지속적으로 관찰되었으며, COMPAS 도구 사례 등 구체적인 사례를 통해 알고리즘 편향이 고용, 사법 등 실생활 영역에서 인종적, 성별 불균형을 강화하며 막대한 인간적 비용을 초래함을 실증하였다. 학술적 의의는 본 연구가 인공지능 윤리 담론에서 실제 발생하고 있는 인간 중심의 피해보다 가상적 미래 존재에 대한 윤리적 몰입이 우선시되는 '알고리즘 사각지대'의 존재를 계량서지학적 데이터를 통해 입증하였다는 데 있다. 이는 인공지능 윤리의 우선순위 재조정과 '공정성 설계', '투명성', '책임 및 구제'를 핵심으로 하는 인간 중심적 프레임워크로의 전환이 시급함을 강조하였으며, AI 윤리가 기계의 권리보다는 인간 존엄성과 사회적 평등을 지키는 데 주력해야 함을 역설하였다.

바로가기

Advancing human–AI teams: evolving from instrumental tools to trusted partners

이 학술 논문은 인간-AI 협업(HAIC)의 새로운 이론적 프레임워크를 정립하기 위해 인간-컴퓨터 상호작용(HCI) 패러다임의 진화 과정과 HAIC에서 직면하는 새로운 도전 과제들을 종합적으로 탐구하였다. 연구 방법론으로는 2000년부터 2025년 1월까지 Scopus, Web of Science, ACM Digital Library 등 주요 데이터베이스에서 수집된 134개 문헌을 대상으로 한 서술형 문헌 검토 방식을 채택하였다. 이 연구는 HCI가 초기의 장비 시대, 대화형 시스템 시대, 자율 에이전트 시대를 거쳐 현재 인간과 AI가 공존하는 AI 시대로 발전하였음을 분석하였다. 주요 발견으로, AI의 의인화는 사용자 신뢰와 참여도를 높이지만, 그 효과는 의인화된 특성의 유형과 맥락에 따라 미묘하게 달라질 수 있으며, 특정 특성은 오히려 정체성 위협을 야기할 수 있다고 지적하였다. 감성 컴퓨팅의 발전은 AI와 인간 사이에 ‘유사-친밀한 관계’를 가능하게 하지만, AI가 생성한 메시지에 대한 인식이 가치 부여를 감소시키는 역설적인 결과를 보였다. 또한, 효율성과 정확도 같은 전통적 성능 지표만으로는 HAIC의 복잡한 관계적 측면을 완전히 포착하기 어렵기 때문에 친밀도, 상호 적응성, 사회적 유대감과 같은 새로운 측정 지표의 필요성을 강조하였다. 다중 에이전트 시스템과 신체화된 AI는 의료, 운송, 재난 대응 등 다양한 실세계 응용 분야에서 협업 가능성을 보였으나, AI 동료의 도입이 오히려 인간 간의 조정 및 신뢰 수준을 감소시킬 수 있다는 중요한 도전 과제도 확인하였다. 이러한 분석을 바탕으로, 이 연구는 관계적 성능 지표 개발, 윤리적 및 사회적 함의에 대한 심층 연구, 인간 중심적인 다중 에이전트 시스템 설계, 그리고 학제 간 협력의 증진을 HAIC 분야의 핵심 연구 우선순위로 제시하며, 인간의 가치와 사회적 책임을 우선하는 미래 HAIC 로드맵을 제안하였다.

바로가기

📖 Journal of Marketing Analytics - 1건

Measuring the disruptiveness of conceptual papers in the field of marketing

마케팅 분야에서 개념 논문의 중요성이 강조되는 가운데, 본 연구는 네트워크 기반 측정 지표인 인용 횟수와 파괴 점수를 활용하여 개념 연구와 실증 연구의 영향력을 비교하였다. 대규모 언어 모델의 도움을 받아 마케팅 저널에 게재된 방대한 수의 논문들을 개념 연구와 실증 연구로 분류하였다. 연구 결과에 따르면 개념 연구는 실증 연구보다 더 자주 인용될 뿐만 아니라, 마케팅 분야에 더 큰 파괴적 영향을 미치는 것으로 나타났다. 본 논문은 대규모 언어 모델을 활용한 정량적 분석을 통해 개념 논문의 가치를 실증적으로 입증하고, 파괴 점수와 같은 새로운 지표를 통해 패러다임을 전환하는 연구의 중요성을 강조하며, 마케팅 분야의 지식 발전 메커니즘을 이해하는 데 기여하였다.

바로가기

📖 Journal of Cheminformatics - 1건

A pipeline for developing AI-driven models to predict molecular initiating events: a case study on neural tube defects

이 연구는 유해결과경로(AOPs)에서 중요한 분자 개시 사건(MIEs)을 예측하기 위한 자동화된 AI 파이프라인을 제시하였다. 이 파이프라인의 목적은 화학 물질의 독성 평가를 개선하고 AOP 개발을 가속화하며, 후속 실험을 위한 메커니즘 우선순위를 정하는 데 기여하는 것이다. 연구 방법론으로는 ChEMBL 생체 활성 데이터를 MIE 예측을 위한 최적화된 딥러닝 모델로 변환하는 자동화된 AI 파이프라인을 구축하였다. 특히, 이 파이프라인은 화학 구조를 지식으로 강화된 분자 그래프로 표현하는 지식 기반 그래프 트랜스포머 사전 학습(KPGT) 프레임워크를 기반으로 하며, 데이터 큐레이션, 분자 그래프 생성, 모델 훈련 및 튜닝 과정을 통합하였다. 이 통합된 접근 방식은 초기 데이터부터 배포 가능한 AI에 이르기까지 목표별 예측 모델을 원활하고 재현 가능한 방식으로 구성할 수 있도록 하였다. 신경관 결함(NTD) 사례 연구를 통해 이 파이프라인의 유용성을 입증하였는데, 여기서 미세 조정된 KPGT 모델은 발달 독성과 관련된 MIE를 예측하는 데 있어 기존의 방사형 기저 함수 커널을 사용하는 서포트 벡터 머신(SVM-RBF) 모델보다 우수한 성능을 보였다. 이러한 핵심 발견은 AI 기반 독성 모델링이 AOP 개발을 가속화하고, 평가 지점 우선순위를 개선하며, 실험적 후속 조치를 위한 화학 물질을 우선순위화할 수 있는 잠재력을 강조하였다. 학술적 의의로는 데이터부터 모델까지의 완전한 워크플로우를 제공함으로써 독성학 분야에서 현대적인 그래프 기반 신경 아키텍처를 사용하는 기술적 장벽을 낮추었다. 또한, 이 연구는 AOP 개발, 화합물 우선순위 지정 및 초기 단계 화학 물질 안전성 평가를 지원하는 재현 가능한 MIE 예측 모델을 제공한다.

바로가기

📖 Scientometrics - 3건

Global open science research in the digital & intelligent era: advances, focuses and prospects

본 연구는 디지털 및 지능형 시대의 글로벌 오픈 사이언스 연구 현황을 체계적으로 요약하고 그 발전 수준을 향상시키는 것을 목표로 하였다. 이를 위해 서지 측정 분석, 대체 측정 추적, BERTopic 주제 모델 및 체계적인 내용 분석을 결합한 다중 방법론적 접근 방식을 사용하였다. 연구 데이터는 중국 국립 지식 인프라(CNKI)와 Web of Science(WoS) 핵심 컬렉션에 색인된 학술 논문을 활용하였으며, Altmetric.com의 대체 측정 지표를 통해 사회적 참여 측면을 포착하였다. 주요 결과로, 글로벌 및 중국의 오픈 사이언스 연구 주제 분포, 발전 과정, 사회적 초점을 분석하였으며, 오픈 액세스, 오픈 데이터, 오픈 교육, 오픈 평가, 오픈 소프트웨어, 인프라, 시민 과학의 일곱 가지 차원에서 현재 오픈 사이언스가 직면한 과제들을 명확히 밝혔다. 또한, 다중 주체 시너지 이론에 기반하여 오픈 사이언스 내 다중 주체들의 시너지적 발전을 위한 이론적 프레임워크를 제안하고, 오픈 사이언스의 발전을 최적화하기 위한 실행 가능한 전략들을 제시하였다. 본 연구는 오픈 사이언스 분야의 현황을 종합적으로 이해하고 미래 발전을 위한 실질적인 방향을 모색하는 데 학술적 의의가 있다.

바로가기

Exploring novelty differences between industry and academia: a knowledge entity-centric perspective

본 연구는 산업계와 학계 중 어느 쪽이 더 참신한 연구 성과를 생산하는지에 대한 기존의 불분명한 지점을 해결하고자 하였다. 연구진은 방법론, 도구, 데이터셋, 측정항목이라는 네 가지 세분화된 지식 엔터티를 사용하여 통합된 의미 공간 내에서 엔터티 간의 의미론적 거리를 계산함으로써 참신성을 정량화하는 방법론을 제시하였다. 이 방법론은 다양한 문헌 유형 간의 참신성 비교 가능성을 제공하였다. 이후 회귀 모델을 구축하여 산업과 학계 간 출판물 참신성 차이를 분석하였으며, OpenAlex의 논문 15,871건과 독점 데이터베이스의 특허 20,934건에 대한 5년간의 인용 데이터를 활용하였다. 핵심 연구 결과로 학계가 더 높은 참신성 결과물을 보였는데, 특히 특허 분야에서 이러한 경향이 두드러졌다. 엔터티 수준에서는 학계와 산업계 모두 논문에서 방법론 중심의 발전을 중요하게 여겼지만, 산업계는 데이터셋 분야에서 독점적인 강점을 나타냈다. 또한, 산학 협력은 연구 논문의 참신성 향상에 미치는 영향이 제한적이었으나, 특허의 참신성을 높이는 데는 긍정적인 효과가 있었다. 참신성과 인용 간의 관계 분석에서는 참신한 논문이 출판 후 5년간 인용 수가 현저히 낮아 학계 평가에서 '지연된 인정' 편향이 존재함을 시사하였고, 반면 참신한 특허는 유의미하게 더 많은 후속 인용을 받았다. 이 연구는 문헌 유형의 한계를 극복하는 일반화된 참신성 평가 프레임워크를 제공함으로써, 산업과 학계의 혁신 역학 관계에 대한 중요한 학술적 통찰을 제시하였다.

바로가기

Mis-indexing advertisements as scholarly documents in Scopus: empirical evidence of document-type misclassification

이 연구는 학술 저널에 게재된 광고가 Scopus 데이터베이스에서 학술 문서 유형으로 잘못 색인되는 현상을 실증적으로 조사하였다. 연구는 Current Science 저널을 사례 연구 대상으로 선정하여, 1993년부터 2024년까지(2026년 2월 20일 업데이트 포함) Scopus에 색인된 총 17,870건의 기록을 분석하는 방법론을 사용했다. 제목 기반 스크리닝과 구조적 평가를 통해, 주로 'Article' 또는 'Note'로 분류된 60건의 광고성 자료를 식별하였다. 핵심 발견으로는 잘못 색인된 광고성 자료들의 대부분이 지난 10년간 발행되었고, 주로 채용 공고 및 연구비 지원 발표 등의 형태였으며, 초록, 참고문헌, 연구 내용과 같은 학술적 특징이 없었다는 점이다. 이러한 기록들이 전체에서 차지하는 비율은 작지만, 핵심 학술 문서 유형으로 포함된 사실은 문서 유형의 무결성과 대규모 데이터베이스에서 도출되는 계량서지학적 지표의 신뢰성에 심각한 우려를 제기했다. 또한, 연구 결과는 자동화된 메타데이터 수집 과정에서 비학술적 콘텐츠의 선택적 오색인이 발생할 수 있음을 시사했다. 이 연구는 주요 서지 데이터베이스에서 광고가 학술 문서로 색인된 첫 경험적 증거를 제공하여 메타데이터 품질, 학술 콘텐츠의 경계 정의, 그리고 서지 인프라의 평가적 건전성에 대한 지속적인 논의에 중요한 학술적 의의를 부여했다.

바로가기

반응형