인공지능 블랙박스 시대 종언 가이드 랩스 설명 가능한 LLM 스테를링-8B 발표

이미지
그동안 인공지능은 수조 개의 파라미터가 얽힌 신경망 속에서 왜 그런 답변을 내놓는지 알 수 없는 블랙박스로 여겨져 왔습니다. 하지만 샌프란시스코의 유망 스타트업 가이드 랩스가 모든 토큰의 출처를 추적할 수 있는 혁신적인 80억 파라미터 규모의 언어 모델 Steerling-8B를 공개하며 판도를 뒤흔들고 있습니다. 인공지능의 투명성과 신뢰성을 획기적으로 높인 이번 발표의 핵심 기술과 미래 산업에 미칠 파급력을 자세히 살펴보겠습니다. 💡 인공지능의 내부를 들여다보는 개념 레이어의 혁신 기존의 딥러닝 모델들은 결과값이 도출되는 과정을 사후에 분석하는 일종의 모델 신경과학 방식에 의존했습니다. 가이드 랩스의 CEO 줄리어스 아데바요와 최고과학책임자 아야 압델살람 이스마일은 이 접근법을 완전히 뒤집었습니다. 이들은 모델 설계 단계부터 개념 레이어(Concept Layer)를 삽입하여 데이터를 추적 가능한 카테고리로 분류하는 새로운 아키텍처를 구축했습니다. 이를 통해 Steerling-8B는 모델이 생성하는 모든 토큰이 훈련 데이터의 어느 부분에서 기인했는지를 명확히 밝혀낼 수 있게 되었습니다. ✅ 할루시네이션과 편향성 문제를 해결할 정교한 통제력 설명 가능한 AI의 등장은 인공지능의 고질적인 문제인 환각 현상(Hallucination)과 아첨 행위(Sycophancy)를 제어하는 데 결정적인 역할을 합니다. 예를 들어 성별이나 인종과 같은 민감한 개념이 모델 내부에서 어떻게 인코딩되는지 파악하고, 필요에 따라 특정 연결을 신뢰성 있게 활성화하거나 비활성화할 수 있습니다. 줄리어스 아데바요는 MIT 박사 과정 시절인 2018년에 발표한 논문을 통해 기존 모델 해석 방식의 한계를 지적한 바 있으며, Steerling-8B는 그 연구 결과가 실무 엔지니어링으로 구현된 최대 규모의 증명 사례입니다. 🔍 규제 산업의 게임 체인저 금융과 과학 분야의 활용 투명성이 필수적인 규제 산업에서 Steerling-8B의 가치는 더욱 빛납니다. 금융권에서 대...

OpenAI의 Sora 오늘 출시 — 첫 리뷰 하이라이트

OpenAI의 비디오 생성기 Sora가 월요일에 출시되었습니다. 유튜버 Marques Brownlee는 Sora에 대한 초기 인상을 전하며, Sora가 최대 1080p 해상도의 비디오를 생성할 수 있고, Re-mix 및 Storyboard 기능을 제공한다고 설명했습니다. 

그러나, 객체 영속성 문제와 다리 혼동 등 일부 결함이 있다고 지적했습니다. Sora는 특정 스타일의 제목 슬라이드, 애니메이션, 추상화 및 스톱 모션 영상에 유용하다고 평가되었습니다.



Sora의 출시

OpenAI의 비디오 생성기 Sora가 월요일에 출시됩니다 — 일부 사용자에게만 해당됩니다. 

유튜버 Marques Brownlee는 오늘 아침 자신의 채널에 게시된 비디오에서 이 소식을 공개했습니다. Brownlee는 Sora에 대한 조기 접근 권한을 얻었고, 15분짜리 리뷰에서 초기 인상을 전했습니다.


Sora의 기능

Brownlee에 따르면, Sora는 Sora.com에서 사용할 수 있으며, 홈페이지에는 최근 생성된 OpenAI가 큐레이션한 Sora 비디오가 스크롤 형태로 표시됩니다. 이 도구는 OpenAI의 AI 기반 챗봇 플랫폼인 ChatGPT에 통합되지 않았으며, 현재로서는 별도의 경험으로 보입니다. 

Sora 홈페이지의 비디오는 나중에 볼 수 있도록 저장됨 탭에 북마크할 수 있으며, 폴더로 정리하고 클릭하여 생성에 사용된 텍스트 프롬프트를 확인할 수 있습니다. Sora는 업로드된 이미지와 프롬프트에서 비디오를 생성할 수 있으며, 기존 Sora 비디오를 편집할 수도 있습니다.


Re-mix 기능

Re-mix 기능을 사용하면 사용자가 비디오에서 보고 싶은 변경 사항을 설명할 수 있으며, Sora는 이를 새로 생성된 클립에 반영하려고 시도합니다. Re-mix에는 사용자가 Sora가 대상 비디오를 얼마나 극적으로 변경할지 지정할 수 있는 강도 설정이 있습니다. 높은 값일수록 더 많은 예술적 자유를 가진 비디오가 생성됩니다.


해상도와 생성 시간

Sora는 최대 1080p 해상도의 영상을 생성할 수 있지만, 해상도가 높을수록 비디오 생성 시간이 길어집니다. 

1080p 영상은 가장 빠른 옵션인 480p보다 8배 더 오래 걸리며, 720p는 4배 더 오래 걸립니다. Brownlee는 평균 1080p 비디오가 몇 분 정도 걸렸다고 말했습니다. 

"지금은 거의 아무도 사용하지 않는 상황에서 그렇습니다. 이게 누구나 사용할 수 있게 되면 얼마나 더 오래 걸릴지 궁금합니다"라고 덧붙였습니다.


Storyboard 기능

Sora는 단일 클립을 생성하는 것 외에도, 사용자가 프롬프트를 연결하여 장면이나 비디오 시퀀스를 만들 수 있는 Storyboard 기능을 제공합니다. 

이는 일관성을 유지하는 데 도움이 될 것으로 보입니다. 이것은 AI 비디오 생성기의 약점으로 알려진 부분입니다.


Sora의 성능

Sora는 다른 생성 도구와 마찬가지로 객체 영속성 관련 문제를 겪고 있습니다. 

Sora 비디오에서는 객체가 서로 앞뒤로 지나가거나 이유 없이 사라졌다가 다시 나타나는 경우가 있습니다. 

다리도 Sora의 주요 문제 중 하나입니다. 사람이든 동물이든 다리가 있는 경우, Sora는 앞다리와 뒷다리를 혼동합니다. 다리가 해부학적으로 불가능한 방식으로 교환 됩니다.


안전 장치

Sora에는 여러 안전 장치가 내장되어 있으며, 18세 미만의 사람을 보여주는 영상, 폭력 또는 명시적 주제를 포함하는 영상, 제3자의 저작권을 침해할 수 있는 영상을 생성하는 것을 금지합니다. 

또한 Sora는 공인, 인식 가능한 캐릭터 또는 로고가 포함된 이미지에서 비디오를 생성하지 않으며, 각 비디오에 쉽게 잘라낼 수 있는 시각적 워터마크를 추가합니다.


Sora의 용도

Brownlee는 Sora가 특정 스타일의 제목 슬라이드, 애니메이션, 추상화 및 스톱 모션 영상에 유용하다고 말했습니다. 

그러나, 그는 포토 리얼리스틱한 용도로는 추천하지 않았습니다. "AI가 생성한 비디오라는 점이 인상적이지만, 대부분의 Sora 클립은 AI가 생성한 비디오라는 것을 금방 알 수 있습니다"라고 말했습니다.


 

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다

댓글

이 블로그의 인기 게시물

로봇 산업의 뜨거운 이슈 - 휴머노이드 경쟁과 로봇 기업의 동향

💧 물로 가는 자동차 ‘아쿠아 드라이브’, 일론 머스크가 정말 공개했을까?

방한 외국인 소비 패턴 변화와 향후 전망: 오렌지스퀘어 보고서 분석