데이터샤우츠
[2026-04-06 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 본문
📖 Journal of Big Data - 1건
Security risk management in the digital enterprise: enhancing cyber defense with large language models
디지털 인프라의 급속한 확장으로 인해 사이버 보안 문제가 심화되었으며, 이에 따라 적응형 지능 기반의 위험 관리 접근 방식이 요구되고 있었다. 본 연구는 탐색적 LLM 기반 사이버 보안 연구와 대규모 데이터 SOC(보안 관제 센터) 환경에서의 배포 지향적 평가 간의 격차를 해소하고자 하였다. 연구팀은 사이버 위협 탐지를 위해 구조화된 네트워크 원격 측정 데이터를 자연어 프롬프트로 재구성하는 방법론을 적용하였으며, GPT-3.5 Turbo와 Mistral-7B를 포함한 지시 튜닝된 대규모 언어 모델(LLM)을 평가하였다. 배포를 고려한 평가 프레임워크를 채택하여 예측 성능, 추론 효율성, 자원 활용도를 종합적으로 측정하였다. 실험 결과, Mistral-7B는 GPT-3.5 Turbo 및 기존 머신러닝/딥러닝 기준 모델들을 일관되게 능가하는 성능을 보였다. 특히 Mistral-7B는 0.9936의 전반적인 정확도와 0.9925의 코헨 카파(Cohen’s Kappa) 값을 달성하였다. 또한, Mistral-7B는 평균 추론 지연 시간을 23.1밀리초로 단축하고 꼬리 지연 시간(P95)을 40.7밀리초로 개선하였으며, GPT-3.5 Turbo에 비해 추론 중 최대 메모리 사용량을 절감하는 효과를 나타냈다. 이러한 연구 결과는 LLM이 확장 가능하고 설명 가능한 기업 수준의 사이버 보안 위험 관리에 매우 적합함을 강조하였다.
📖 Data Mining and Knowledge Discovery - 1건
Exploring zero-shot essay scoring: from feature-based to LLM-based approaches
본 연구는 기존 자동 에세이 채점(AES) 시스템이 특정 프롬프트에 종속적인 대규모 레이블 데이터를 필요로 하여 일반화에 한계가 있다는 문제를 해결하고자 하였다. 이에 연구진은 레이블 데이터 의존도를 줄이는 프롬프트 독립적(prompt-agnostic) 다중 특성(multi-trait) 제로샷(zero-shot) AES 접근법들을 탐구하였다. 연구진은 LLM 기반, BERT 계열 미세조정 모델, 단순 특징 기반 방법들을 검토하고, 'CAnUSe'와 'EASY'라는 두 가지 새로운 프레임워크를 제안했다. CAnUSe는 LLM이 에세이 쌍을 비교 평가하여 의사 점수를 생성한 후, 불확실성 지표를 활용해 신뢰도 높은 샘플을 선별하고 이를 바탕으로 더 작은 단일 에세이 채점 모델을 자가 학습(self-training)시키는 방식이다. 반면 EASY는 에세이 길이, 어휘 다양성, 문법 정확도라는 세 가지 직관적인 특징만을 사용하였다. ASAP++, Ellipse, TOEFL11 등 세 가지 벤치마크 데이터셋을 사용한 광범위한 실험 결과, 제안된 프레임워크들은 데이터셋 전반에 걸쳐 강력한 일반화 성능을 보이며 최신 기술 수준을 달성했다. 특히 CAnUSe는 제로샷 설정임에도 불구하고 약 1만 개의 레이블 샘플로 훈련된 완전 지도 학습 모델에 근접하는 성능을 보였으며, EASY 역시 단순함에도 불구하고 일부 지도 학습 기반 특징 공학 모델을 능가하는 결과를 나타냈다. 본 연구는 효과적인 제로샷 AES 프레임워크를 제시함으로써 실제 교육 환경에서 데이터 효율적인 AES 시스템을 구축하기 위한 실용적인 통찰과 학술적 기여를 제공하였다.
📖 AI & Society - 2건
Persuasive machines: large language models and the art of rhetoric
본 학술 논문 "설득하는 기계: 대규모 언어 모델과 수사학의 기술"은 대규모 언어 모델(LLM)이 진실성보다는 유창성, 일관성, 맥락 적합성에 최적화되어 강력한 설득력을 지니지만, 그 내용의 진실성을 모른다는 점을 연구 질문으로 삼았다. 저자는 서구 철학 전통의 수사학 비판적 관점과 철학 자체의 수사학적 의존성을 교차 분석하는 방법론을 통해 LLM의 본질을 탐구하였다. 핵심 발견은 LLM이 의도적으로 속이지 않지만, 약한 논증을 그럴듯하게 만들고 이해 없이 전문성을 시뮬레이션하는 '설득하는 기계'로서, 담론이 진실과 무관하게 설득력을 발휘할 수 있음을 보여주었다는 점이다. 이는 고대부터 이어져 온 수사학에 대한 철학적 불안을 기술적으로 증폭시키며, 동시에 철학적, 과학적 담론 또한 설득의 요소에 의존해 왔음을 드러냈다. 학술적 의의는 LLM이 진실에서 유리된 담론으로 공론장을 오염시킬 위험을 제기하며 철학적 위기를 촉발함에도 불구하고, 언어의 설득적 힘과 권위 형성 과정을 이해하는 데 있어 수사학 등 인문학적 리터러시가 필수적임을 재확인시켜 준다는 점이다. LLM은 단순히 정보 전달의 오류를 넘어, 언어가 사람을 움직이는 본질적인 힘을 가졌다는 인문학적 교훈을 기술적으로 재강조하는 '수사학적 기계'로 이해되어야 한다고 결론 내렸다. 이러한 통찰은 언어의 작동 방식과 설득의 기술에 대한 새로운 리터러시 교육의 중요성을 역설하였다.
AI-generated child sexual abuse material: what’s the harm?
본 논문은 인공지능이 생성한 아동 성착취물(AI CSAM)이 실제 피해자가 없다는 인식으로 인해 유해성이 덜하다는 주장을 반박하고, 그와 관련된 실질적인 위험을 규명하고자 하였다. 이를 위해 연구진은 기술 문헌, 심리학 및 범죄학 연구, 그리고 시민 사회와 법 집행 기관의 보고서를 종합하는 서술적 검토 및 개념적 종합 방법을 사용하였다. 연구의 핵심 발견으로, AI CSAM과 관련된 일곱 가지 구체적인 해악이 도출되었다. 여기에는 실제 아동을 묘사하여 발생하는 재희생 문제, 그루밍 및 성착취를 위한 도구로의 악용, 아동 성착취의 정상화 및 둔감화, 범죄 행위로 나아가는 관문 역할, 청소년에 의한 동료 착취, 법 집행 기관의 탐지 및 보호 역량 저하, 그리고 상업화를 통한 착취 경제 심화가 포함되었다. 결론적으로, 이 연구는 AI CSAM이 무해하거나 해악 감소 도구로 기능할 수 있다는 주장은 현실의 복합적인 위험을 간과하는 것이며, AI CSAM은 중립적 기술이 아니라 적극적인 해악의 촉진자임을 강조하였다. 이는 기술 개발자, 정책 입안자, 아동 보호 기관 등이 이 문제에 대해 시급히 대응해야 할 필요성을 강력히 시사한다.
📖 Journal of Cheminformatics - 1건
Is scaffold hopping possible in machine learning using the electronic-structure-informatics (ESI) descriptor set? an application to natural-product-based drug discovery of α-glucosidase inhibitors
본 연구는 α-글루코시다제 억제제 천연물 기반 신약 발견에서 전자 구조 정보(ESI) 기술 세트와 기계 학습을 활용한 스캐폴드 호핑의 가능성을 탐색하였다. 연구팀은 α-글루코시다제 억제 활성(pIC50)에 대한 회귀 모델링을 통해 가상 스크리닝을 수행하였으며, 이를 위해 ESI 기술 세트를 사용한 XGBoost 모델을 적용하였다. 최적화된 모델은 0.85의 테스트 R² 값을 달성하여 높은 예측 정확도를 보여주었다. 2623개의 천연물에 대한 가상 스크리닝을 통해 기존에 알려진 α-글루코시다제 억제제인 테아시넨신 A, 체불라직산, 카수아릭틴 등을 재확인하였을 뿐만 아니라, 알려진 억제제와는 다른 새로운 스캐폴드를 가진 구조적으로 새로운 천연물 화합물들을 발견하였다. 새롭게 발견된 화합물들에 대한 도킹 시뮬레이션 결과, 시판 약물인 아카보스보다 높은 결합 점수를 나타내었다. 이러한 결과는 ESI 기술 세트가 기존의 구조 기반 검색을 넘어 천연물 데이터베이스에서 α-글루코시다제 억제제를 발견하기 위한 효과적인 스캐폴드 호핑을 지원함을 입증하였다. 이는 양자 화학 기반 ESI 기술자와 기계 학습의 결합이 화학적으로 다양한 신약 후보 물질을 식별하는 데 있어 전자 구조 정보의 가치를 보여주었다는 점에서 학술적 의의가 있다.
'논문(AI,DATA)' 카테고리의 다른 글
| [2026-04-09 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 (1) | 2026.04.09 |
|---|---|
| [2026-04-08 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 (0) | 2026.04.08 |
| [2026-04-03 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 (1) | 2026.04.03 |
| [2026-04-02 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 (0) | 2026.04.02 |
| [2026-04-01 | Data Frontier] 한눈에 보는 AI x 비즈니스 분야 연구 동향 (0) | 2026.04.01 |
