베타웍스, 최신 '캠프' 코호트에서 AI 에이전트에 베팅

베타웍스는 AI 트렌드를 더 이상 LLM으로 받아들이지 않고, 오히려 일상적인 작업을 자동화하는 일련의 에이전트형 모델들을 정의하기 어려운 것들로 향상시키기로 결정했다. 투자자의 최신 "캠프" 인큐베이터는 미래에 오늘의 더 거추장스러운 작업을 맡을 AI 에이전트 스타트업인 9개를 훈련시키고 자금을 지원하고자 한다.

이 회사들의 많은 사용 사례들은 유망해 보이지만, AI는 약속을 지키는 데 어려움을 겪는 경향이 있다. 훌륭한 새로운 AI에게 이메일 정리를 맡기겠습니까? 웹 페이지에서 정보를 추출하고 구조화하기를 바랍니까? 누군가는 어느 시간에 회의를 잡을지 상관하지 않을까요?

이러한 서비스에는 아직도 확실한 믿음 요소가 남아 있으며, 이는 우리의 행동 방식을 바꾸는 대부분의 기술에서 발생하는 현상입니다. MapQuest에 길 안내를 요청하는 것은 이상하게 느껴졌지만 그렇지 않았고, 지금은 GPS 네비게이션이 일상적인 도구가 되었습니다. 하지만 AI 에이전트들은 이미 그 정도의 단계에 있는가요? 베타웍스 CEO이자 설립자인 존 보스윅은 그렇게 생각합니다. (공시: 전 테크크런치 편집장이자 디스럽트 호스트 조던 크룩은 회사에서 일하러 테크크런치를 떠났습니다.)

"우리가 많은 시간을 투자해 고민해온 것에 대해 기점을 찍고 있습니다," 그는 테크크런치에 말했다. "agentic AI는 아직 초창기 단계에 있지만, 에이전트의 성공률 등에 대한 문제가 있습니다. 그럼에도 불구하고, 캠프가 시작된 이후에도 막대한 진전을 보고 있습니다."

기술은 계속해서 개선될 것이지만 보스윅은 일부 고객들이 현재 상태에서 그것을 받아들일 준비가 되어 있다고 설명했다.

"역사적으로 제품이 '충분히 좋았다'면 굳이 개별적인 작업을 맡기지 않더라도 고객들이 믿고 수행하는 경우가 더러 있습니다. 원래의 Bill.com은 OCR 및 이메일 추출과 관련한 흥미로운 작업들을 수행하지만, 항상 정확히 수행되지는 않았고 사용자들은 몇 천 달러 가치의 거래에도 불구하고 여전히 믿고 있었으며 이는 끔찍한 작업을 덜 끔찍하게 만들기 때문입니다. 시간이 지남에 따라, 이러한 고객들로부터의 피드백 루프가 더 나은, 믿을만한 제품을 만들어내었습니다," 그는 말했다.

"현재 캠프의 제품의 초기 사용자 대부분은 개발자, 창립자 및 초기 기술 채용자들이며, 이 그룹은 항상 이러한 제품에 대한 참기능한 테스트를 하고 피드백을 제공하고, 이러한 제품이 이르면 정상적인 상황으로 전환되게 합니다."

베타웍스, 최신 캠프 코호트에서 보완적인 AI에 모두 배팅: '우리는 열광적으로 관심을 가지고 있습니다'

베타웍스 캠프는 선택된 회사들이 제품, 전략 및 연결에 대한 실질적인 도움을 받은 후 베타웍스, Mozilla Ventures, Differential Ventures 및 Stem AI의 50만 달러 수표를 받기 전에 3개월간 가속화 프로그램에 참여합니다. 그러나 데모 데이인 5월 7일에 제품을 선보일 때까지 알찬 쇼를 펼쳤다.

그 전에 라인업을 미리 확인했는데, 여기서 가장 인상적인 3가지를 소개하겠습니다.

더블은 소프트웨어 인터페이스를 대표하는 많은 데이터를 기반으로 모델을 훈련시킴으로써 일반 언어로 특정 작업을 설명하거나 보여주는 사용 방법을 통해 특정 작업을 수행하는 사용 방법을 학습할 수 있는 "액션 모델"을 사용하여 작업을 자동화합니다. API가 처리할 수 없는 복잡한 작업물을 처리하는 데 적합하다고 이 회사들은 주장합니다. 그들을 지난 1월에 기사로 쓰기도 했습니다.

이미지 크레딧: 트윈

그래서 백엔드 엔지니어가 특정 작업을 수행하는 사용자 정의 스크립트를 작성하는 대신, 일반 언어로 설명하거나 보여줄 수 있습니다. "오늘 받은 모든 이력서를 드롭박스 폴더에 넣고 지원자 이름으로 바꾸고 나서 슬랙에서 공유 링크를 DM해주세요." 이러한 워크플로우를 수정하면 ("이번에는 신청일을 파일 이름에 추가하세요") 그것이 새로운 작업 방법이 될 수 있습니다. 시간의 80%를 차지하는 20%의 작업을 자동화하는 것이 회사의 목표입니다. 이를 비용 효율적으로 수행할 수 있는지가 진정한 문제일 것입니다. (트윈은 모델 및 교육 프로세스의 성격에 대해 자세히 설명하지 않았습니다.)

스케즈는 두 명(또는 세 명, 네 명...) 사이의 모임 시간을 찾는 과정을 가끔 괴로워하는 문제를 개선하려고 합니다. 이메일이나 슬랙 스레드에 봇을 참조하면 모든 사람들의 가용성과 선호도를 조율하기 시작합니다. 일정에 액세스할 수 있다면 해당 일정을 확인합니다. 누군가가 목요일 오후에 좋다고 말했다면 해당 선택과 협력합니다. 일부 사람에게 우선순위를 부여할 수 있으며 등등. 숙련된 행정 보조사와 일하는 사람은 그들이 교체 불가능하다는 것을 알지만, 분명히 모두가 '이것 어떨까요? 아니면 이렇게 어때요?'라는 과제에 덜 시간을 투자하기를 원할 것입니다.

이미지 크레딧: 스카

인간 청킹용 시각 모델들의 오늘날의 향상된 이해를 활용하여 그림 시각화 기회를 이용하여 상대적으로 비구조적인 맥락으로부터 데이터를 추출할 수 있는 Jsonify는 웹 크롤러에게 액세스할 수 없을 수도 있는 데이터를 더 잘 파싱하고 정렬하게 됩니다.

이미지 크레딧: Jsonify

예를 들어 특정 지역의 Airbnb 옵션을 검색하고 나서 Jsonify가 그들을 모두 가격, 공항에서의 거리, 등급, 숨겨진 요금 등의 열에 대한 구조화된 목록으로 변환할 수 있습니다. 그런 다음 Vacasa에서 같은 것을 할 수 있으며 동일한 장소에 대해 (나는 이를 하고 어제 약 $150을 절약했지만, 이 프로세스를 자동화했으면 좋았을텐데). 또는 전문적인 작업을 수행하십시오.

그러나 LLM에 내재된 부정확성이 그것들을 위한 의문할 여지가 있을까요? 창업자 인 폴 헌킨은 '우리는 상당히 견고한 가드레일 및 상호 확인 시스템을 구축했다고 말했다.' "페이지를 이해하기 위해 런타임에서 몇 가지 다른 모델을 사용하여 유효성 검사를 제공하고 사용 사례에 맞춰 세밀하게 조정된 LLM을 사용하기 때문에 가드레일 레이어 없이도 그들은 보통 상당히 신뢰할 수 있습니다. 보통 사용 사례에 따라 95% 이상의 추출 정확도를 확인할 수 있습니다."

나는 아마 어느 기술 중심적인 비즈니스에서도 이러한 제품이 유용하게 쓰일 수 있을 것입니다. 코호트의 다른 회사들은 좀 더 기술적이거나 상황적인 것들이지만 남은 6개는 다음과 같습니다:

  • Resolvd AI - 클라우드 워크플로우의 에이전틱 자동화. 맞춤 통합이 이를 따라 잡을 때까지 유용해 보입니다.
  • Floode - 이전보다는 덜 중요한 것을 찾아내는 AI 이메일 버들러입니다. 정확한 대응 및 조치를 취합니다.
  • Extensible AI – AI가 회귀하고 있습니까? 배포에 적합한 테스트 및 로깅 인프라인 Extensible가 적합한지 의사에게 물어보세요.
  • Opponent - 어린이들이 광범위한 상호 작용과 놀이를 하기 위한 가상 캐릭터입니다. 윤리적·법적 면에서 민폐가 될 수 있지만 누군가가 그 중간을 거쳐야 할 수도 있습니다.
  • High Dimensional Research - 인프라 플레이. 회사의 실험이 실패할 경우 몇 달러만 지불하면 됩니다.
  • Mbodi - 로봇에 대한 생성적인 AI, 연구에 있어서 레어한 교육 데이터. 아프리카 말인 줄 알았는데 그냥 "상체"입니다.

점점 더 자동화된 소프트웨어 워크플로우에서 AI 에이전트들이 어떤 역할을 할 것인가에 대한 의문은 가까운 미래에는 이루어질 것입니다. 그 역할의 성격과 범위는 아직 쓰여지지 않았습니다. 분명히 베타웍스는 일부 제품이 아직 대중 시장에 나와야 할 정도로 준비되지 않았더라도 일찍 발을 질렀다고 볼 수 있습니다.

5월 7일에 이 회사들이 자신의 에이전트 제품을 공개할 수 있습니다.

수정: 이 이야기는 Jsonify의 설립자가 Ananth Manivannan이 아니라 Paul Hunkin임을 반영한 내용을 업데이트했습니다.