← 목록으로
위대한 미국의 유산 – 생성형 AI 스포츠 중계

위대한 미국의 유산 – 생성형 AI 스포츠 중계

댄 무어(Dan Moore)가 제작한 위대한 미국의 놀이(The Great American Pastime)는 생성형 AI와 스포츠 스토리텔링을 결합해, 인피니트 야구 라디오 네트워크(The Infinite Baseball Radio Network)에서 끝없이 이어지는 가상의 야구 경기를 중계합니다. 경기 시뮬레이션과 스포츠 캐스팅에는 최첨단 생성형 AI가 활용되며, 시각적으로 매력적인 웹 인터페이스와 미디어 스트리밍 아키텍처가 이를 뒷받침합니다.

친숙하면서도 묘하게 인공적인 미국의 국민 스포츠 세계로 청취자를 초대하는 이 작품은, 기술·향수·미국 문화 정체성을 빚어온 서사들과 인간의 관계가 얼마나 복잡하게 얽혀가고 있는지를 되돌아보게 합니다.

이 시스템은 경기 시뮬레이션 엔진, AI 스포츠캐스터 모듈, 오디오 스트리밍 및 미디어 처리, 프론트엔드 사용자 인터페이스 등 여러 요소로 구성됩니다. 프로젝트는 댄 무어(Dan Moore, 머신러닝 및 크리에이티브 디렉션), 팀 놀란(Tim Nolan, 브랜딩), EMMA(개발), 앤티도트(Antidote, 디자인)의 협업으로 완성되었습니다.

파인튜닝된 Phi-2 소형 언어 모델을 기반으로 한 경기 시뮬레이션 엔진은 경기별 타석 단위의 구조화된 데이터를 생성합니다.

언어 모델

  • Phi-2는 2개 프로야구 시즌에서 수집한 약 35만 타석 분량의 구조화 데이터를 바탕으로, NVIDIA L40 GPU를 활용해 2주에 걸쳐 학습되었습니다.
  • 모든 투구, 점수, 주자 위치, 결과 설명 텍스트까지 포함한 정밀한 시뮬레이션 데이터를 출력합니다.

생성 데이터

  • 투구별 세부 정보: 각 투구의 종류, 구속, 결과(스트라이크, 볼, 파울 등).
  • 타석 결과: 삼진, 단타, 홈런 등의 결과.
  • 게임 상태 업데이트: 주자 위치, 아웃 카운트, 점수를 실시간으로 추적.

스테이트 머신

  • 단순한 스테이트 머신이 전체 게임 흐름을 관리합니다.
  • 점수, 아웃 카운트, 이닝 표리, 팀 공수 순서를 추적합니다.
  • 플레이와 이닝 사이의 전환이 자연스럽게 이어지도록 합니다.
  • SML이 흐름을 놓칠 때를 대비한 오류 보정 기능도 포함합니다.

AI 스포츠캐스터 모듈은 생성형 AI를 활용해 구조화된 경기 데이터를 생동감 넘치는 오디오 해설로 변환합니다. 잭 존스턴(Jack Johnston)과 피트 프랭크스(Pete Franks), 두 AI 에이전트가 스포츠캐스터로 등장하는데, 구조화된 데이터를 GPT-4o-mini 프롬프트로 인코딩해 캐릭터에 생명을 불어넣습니다. GPT-4o-mini는 플레이-바이-플레이 데이터를 바탕으로 해설 대화를 생성하며, 경기의 긴장감과 선수 통계, 상황별 맥락을 반영해 실감나는 중계를 만들어냅니다. 여기에 두 개의 XTTS-v2 스피치 디퓨전 모델이 텍스트 음성 변환(TTS)을 수행해, 실제 스포츠캐스터처럼 자연스럽고 전문적인 목소리를 구현합니다.

오디오 스트림은 LiquidSoap 스트리밍 서버와 AzureCast 스트리밍 서버가 함께 담당합니다. LiquidSoap 서버는 게임 해설을 재생하고 AI가 생성한 관중 소음을 믹스하며, 프론트엔드 웹 인터페이스를 지원하는 실시간 메타데이터도 제공합니다. AzureCast 스트리밍 서버는 메인 MP3 스트림과 HLS 스트림의 송출을 맡습니다.

프론트엔드 시스템은 Antidote가 디자인하고 EMMA 협동조합이 개발했습니다. 반응형의 동적인 UI 구현을 위해 Vue.js를 기반으로 구축되었으며, 실시간 애니메이션과 게임 시각화에는 PixiJS가 활용되었습니다. 전체 시스템은 LiquidSoap 스트리밍 서버가 제공하는 메타데이터로 구동됩니다. 라이브 스코어보드는 오디오 스트림과 동기화되어 현재 점수, 이닝 진행 상황, 선수 정보를 실시간으로 표시하며, 내장된 플레이어를 통해 LiquidSoap 서버의 오디오 해설을 직접 스트리밍합니다.


게임 시뮬레이션 →

Phi-2가 타석 데이터를 생성하고, 상태 머신이 이를 실시간으로 업데이트합니다.

해설 생성 →

GPT-4o-mini가 플레이별 역동적인 음성 해설을 실시간으로 만들어냅니다.

TTS가 텍스트를 실감 나는 음성으로 변환합니다.

스트리밍 →

LiquidSoap이 오디오 스트림을 인코딩해 송출하며, 프론트엔드 동기화를 위한 메타데이터를 함께 전송합니다.

프론트엔드 렌더링 →

Vue.js와 PixiJS가 메타데이터 API를 기반으로 실시간 통계, 애니메이션, 스코어보드를 화면에 구현합니다.


확장성과 이중화: LiquidSoap과 AI 컴포넌트는 클라우드 인프라 위에서 운영되며, 청취자 수요에 따라 유연하게 확장됩니다. HLS 스트리밍은 다양한 기기와 네트워크 환경에 대응할 수 있도록 해줍니다.

더 그레이트 아메리칸 패스타임(The Great American Pastime)은 Phi-2의 정밀한 경기 시뮬레이션, GPT-4o-mini의 생동감 넘치는 중계, LiquidSoap의 매끄러운 미디어 스트리밍, 그리고 Antidote와 EMMA의 첨단 디자인 및 개발 역량이 하나로 결합된 프로젝트입니다. 이 모든 요소가 어우러져 AI와 현대 웹 기술로 스포츠 중계의 새로운 가능성을 제시하는 완전한 몰입형 경험을 만들어냅니다.

프로젝트 페이지 | 댄 무어(Dan Moore)

이곳에서 후원하여 이 프로젝트를 응원해 주세요.