대형 언어 모델(LLM)의 금융 응용 통합은 의사 결정 프로세스 개선, 운영 자동화 및 개인화 서비스 제공에 현저한 잠재력을 보여줍니다. 그러나 금융 시스템의 고위험 특성은 매우 높은 신뢰성을 요구하며, 현재 LLM은 이를 충족하기 어려운 경우가 많습니다. 본 연구는 LLM 기반 금융 시스템에서의 3대 신뢰성 도전 과제를 식별하고 탐구합니다: (1) 회피형 프롬프트 - 모델 정렬 취약점을 이용해 유해하거나 규제 위반 응답 생성; (2) 환상 현상 - 모델이 사실과 다른 출력을 생성하여 금융 의사 결정을 오도; (3) 편향 및 공정성 문제 - LLM 내장 인구통계학적 또는 제도적 편향으로 인해 개인 또는 지역이 불공정하게 대우받을 수 있음. 이러한 위험을 구체적으로 제시하기 위해, 금융 관련 3가지 테스트를 설계하고 독점 및 오픈소스 계열의 주요 LLM을 평가하였습니다. 모든 모델에서 각 테스트마다 최소 한 번 이상 위험 행동이 나타났습니다. 이 발견을 바탕으로 기존 위험 완화 전략을 체계적으로 요약하였습니다. 우리는 이러한 문제 해결이 금융 분야 AI의 책임 있는 사용 보장뿐만 아니라 안전하고 확장 가능한 배포의 핵심이라고 생각합니다.