댄 무어(Dan Moore)가 제작한 위대한 미국의 놀이(The Great American Pastime)는 생성형 AI와 스포츠 스토리텔링을 결합해, 인피니트 야구 라디오 네트워크(The Infinite Baseball Radio Network)에서 끝없이 이어지는 가상의 야구 경기를 중계합니다. 경기 시뮬레이션과 스포츠 캐스팅에는 최첨단 생성형 AI가 활용되며, 시각적으로 매력적인 웹 인터페이스와 미디어 스트리밍 아키텍처가 이를 뒷받침합니다.
친숙하면서도 묘하게 인공적인 미국의 국민 스포츠 세계로 청취자를 초대하는 이 작품은, 기술·향수·미국 문화 정체성을 빚어온 서사들과 인간의 관계가 얼마나 복잡하게 얽혀가고 있는지를 되돌아보게 합니다.
이 시스템은 경기 시뮬레이션 엔진, AI 스포츠캐스터 모듈, 오디오 스트리밍 및 미디어 처리, 프론트엔드 사용자 인터페이스 등 여러 요소로 구성됩니다. 프로젝트는 댄 무어(Dan Moore, 머신러닝 및 크리에이티브 디렉션), 팀 놀란(Tim Nolan, 브랜딩), EMMA(개발), 앤티도트(Antidote, 디자인)의 협업으로 완성되었습니다.
파인튜닝된 Phi-2 소형 언어 모델을 기반으로 한 경기 시뮬레이션 엔진은 경기별 타석 단위의 구조화된 데이터를 생성합니다.
언어 모델
Phi-2는 2개 프로야구 시즌에서 수집한 약 35만 타석 분량의 구조화 데이터를 바탕으로, NVIDIA L40 GPU를 활용해 2주에 걸쳐 학습되었습니다.
모든 투구, 점수, 주자 위치, 결과 설명 텍스트까지 포함한 정밀한 시뮬레이션 데이터를 출력합니다.
생성 데이터
투구별 세부 정보: 각 투구의 종류, 구속, 결과(스트라이크, 볼, 파울 등).
타석 결과: 삼진, 단타, 홈런 등의 결과.
게임 상태 업데이트: 주자 위치, 아웃 카운트, 점수를 실시간으로 추적.
스테이트 머신
단순한 스테이트 머신이 전체 게임 흐름을 관리합니다.
점수, 아웃 카운트, 이닝 표리, 팀 공수 순서를 추적합니다.
플레이와 이닝 사이의 전환이 자연스럽게 이어지도록 합니다.
SML이 흐름을 놓칠 때를 대비한 오류 보정 기능도 포함합니다.
AI 스포츠캐스터 모듈은 생성형 AI를 활용해 구조화된 경기 데이터를 생동감 넘치는 오디오 해설로 변환합니다. 잭 존스턴(Jack Johnston)과 피트 프랭크스(Pete Franks), 두 AI 에이전트가 스포츠캐스터로 등장하는데, 구조화된 데이터를 GPT-4o-mini 프롬프트로 인코딩해 캐릭터에 생명을 불어넣습니다. GPT-4o-mini는 플레이-바이-플레이 데이터를 바탕으로 해설 대화를 생성하며, 경기의 긴장감과 선수 통계, 상황별 맥락을 반영해 실감나는 중계를 만들어냅니다. 여기에 두 개의 XTTS-v2 스피치 디퓨전 모델이 텍스트 음성 변환(TTS)을 수행해, 실제 스포츠캐스터처럼 자연스럽고 전문적인 목소리를 구현합니다.
왼쪽: 입력 / 오른쪽: 출력
오디오 스트림은 LiquidSoap 스트리밍 서버와 AzureCast 스트리밍 서버가 함께 담당합니다. LiquidSoap 서버는 게임 해설을 재생하고 AI가 생성한 관중 소음을 믹스하며, 프론트엔드 웹 인터페이스를 지원하는 실시간 메타데이터도 제공합니다. AzureCast 스트리밍 서버는 메인 MP3 스트림과 HLS 스트림의 송출을 맡습니다.
프론트엔드 시스템은 Antidote가 디자인하고 EMMA 협동조합이 개발했습니다. 반응형의 동적인 UI 구현을 위해 Vue.js를 기반으로 구축되었으며, 실시간 애니메이션과 게임 시각화에는 PixiJS가 활용되었습니다. 전체 시스템은 LiquidSoap 스트리밍 서버가 제공하는 메타데이터로 구동됩니다. 라이브 스코어보드는 오디오 스트림과 동기화되어 현재 점수, 이닝 진행 상황, 선수 정보를 실시간으로 표시하며, 내장된 플레이어를 통해 LiquidSoap 서버의 오디오 해설을 직접 스트리밍합니다.
게임 시뮬레이션 →
Phi-2가 타석 데이터를 생성하고, 상태 머신이 이를 실시간으로 업데이트합니다.
해설 생성 →
GPT-4o-mini가 플레이별 역동적인 음성 해설을 실시간으로 만들어냅니다.
TTS가 텍스트를 실감 나는 음성으로 변환합니다.
스트리밍 →
LiquidSoap이 오디오 스트림을 인코딩해 송출하며, 프론트엔드 동기화를 위한 메타데이터를 함께 전송합니다.
프론트엔드 렌더링 →
Vue.js와 PixiJS가 메타데이터 API를 기반으로 실시간 통계, 애니메이션, 스코어보드를 화면에 구현합니다.
확장성과 이중화: LiquidSoap과 AI 컴포넌트는 클라우드 인프라 위에서 운영되며, 청취자 수요에 따라 유연하게 확장됩니다. HLS 스트리밍은 다양한 기기와 네트워크 환경에 대응할 수 있도록 해줍니다.
더 그레이트 아메리칸 패스타임(The Great American Pastime)은 Phi-2의 정밀한 경기 시뮬레이션, GPT-4o-mini의 생동감 넘치는 중계, LiquidSoap의 매끄러운 미디어 스트리밍, 그리고 Antidote와 EMMA의 첨단 디자인 및 개발 역량이 하나로 결합된 프로젝트입니다. 이 모든 요소가 어우러져 AI와 현대 웹 기술로 스포츠 중계의 새로운 가능성을 제시하는 완전한 몰입형 경험을 만들어냅니다.
Created by Dan Moore , The Great American Pastime combines Generative AI with sports storytelling to broadcast an endless series of fictional baseball games on The Infinite Baseball Radio Network . This project relies on advanced Gen AI for game simulation and sportscasting, combined with a visually engaging web interface and media streaming architecture. By inviting listeners into a familiar yet subtly artificial version of America’s favorite pastime, the work provokes reflection on humanity’s increasingly tangled relationship with technology, nostalgia, and the narratives that shape the American cultural identity. The system includes a number of components, starting with a game simulation engine, AI sportscaster module, audio streaming and media handling and a frontend user interface. The project is a collaboration between Dan Moore (Machine Learning + Creative Direction), Tim Nolan (Branding), EMMA (Development) and design by Antidote. The Game Simulation Engine , powered by a fine-tuned Phi-2 small language model, generates structured play-by-play data for each game. Language Mode Phi-2 was trained on ~350,000 at-bats in structured data from two professional baseball seasons over two weeks on NVIDIA L40 GPUs. Outputs highly detailed simulations, including every pitch, scores, base runner position, and a text description of the outcome Generated Data Pitch-by-pitch details: Type, speed, and result of each pitch (e.g., strike, ball, foul). At-bat outcomes: Results such as strikeouts, singles, or home runs. Game state updates: Tracks base runners, outs, and score. State Machine A simple state machine manages the overall game context: Tracks score, outs, innings top or bottom, and team turns. Ensures logical transitions between plays and innings. Error Correction for when the SML skips a beat The AI Sportscaster Module transforms structured game data into engaging audio commentary using Generative AI. Two AI Agents, the two sportscasters Jack Johnston and Pete Franks, are brought to life by encoding the structured data into prompts for GPT-4o-mini. GPT-4o-mini generates sportscaster dialogue based on play-by-play data. It Tailors commentary to reflect game intensity, player statistics, and situational context. Two XTTS-v2 speech diffusion models perform Text-to-Speech creating lifelike, professional-sounding sportscaster voices. Left: Input / Right: Output The Audio Stream is handled by a LiquidSoap streaming server and an AzureCast streaming server. The LiquidSoap server handles playing back the game commentary and mixes in AI generated crowd noise. The LiquidSoap server also provides real-time metadata to support the frontend Web interface.The AzureCast streaming server handles broadcasting the main MP3 stream and HSL stream. The Frontend System , designed by Antidote and developed by the EMMA cooperative, provides a visually rich and user-friendly experience. The front end is built with Vue.js for responsive and dynamic UI. PixiJS was utilized for the real-time animations and game visualizations. The system is driven by meta data provided by the LiquidSoap streaming server. The Live Scoreboard sync with the audio stream to provide the current score, inning progression, and player details. An embedded player streams audio commentary directly from the LiquidSoap server. Game Simulation → Phi-2 generates structured at-bat data, updated by the state machine. Commentary Generation → GPT-4o-mini creates dynamic, play-by-play audio commentary. TTS converts text to lifelike audio. Streaming → LiquidSoap encodes and broadcasts the audio stream, embedding metadata for frontend synchronization. Frontend Rendering → Vue.js and PixiJS render real-time stats, animations, and scoreboards, driven by metadata APIs. Scalability and Redundancy : LiquidSoap and AI components run on cloud infrastructure, scaling to accommodate listener demand. HLS streaming ensures adaptability across devices and network conditions. The Great American Pastime combines Phi-2’s precise game simulation, GPT-4o-mini’s engaging commentary, LiquidSoap’s seamless media streaming, and Antidote and EMMA's cutting-edge design and development expertise. Together, these components deliver a fully immersive experience that reimagines sports broadcasting through AI and modern web technologies. Project Page | Dan Moore Please support this project by donating here .