TABQAWORLD: Optimizing Multimodal Reasoning for Multi-Turn Table Question Answering
arXiv:2604.03393v1 Announce Type: new Abstract: Multimodal reasoning has emerged as a powerful framework for enhancing reasoning capabilities of reasoning models.
AI 업계의 최신 소식을 빠르게 확인하세요.
arXiv:2604.03393v1 Announce Type: new Abstract: Multimodal reasoning has emerged as a powerful framework for enhancing reasoning capabilities of reasoning models.
arXiv:2604.03479v1 Announce Type: new Abstract: Contextdependent sequential decision making is commonly addressed either by providing context explicitly as an input or by increasing recurrent memory so that contextual information can be represented internally.
Zero Shot, a new venture capital fund with deep ties to OpenAI, is aiming to raise $100 million for its first fund. It has already written some checks.
오픈AIOpenAI는 신세계그룹과 함께 인공지능을 활용해 일상적인 쇼핑 경험을 한층 더 직관적이고 개인화 된 방향으로 발전시키기 위한 협력을 추진한다.이를 위해 OpenAI 코리아는 신세계그룹과 함께 6일 웨스틴 조선 서울에서 ‘AI 커머스 사업협력’ 양해각서MOU를 체결했다고 밝혔다. OpenAI 코리아 김경훈 총괄대표와 신세계그룹 임영록 경영전략실장사장 등이 참석한 가운데 진행된 협약식에서 양사는 신세계그룹의 AI 커머스 도입과 AI 쇼핑 에이전트 개발, AXAI 전환 등에 대해 협력하기로 뜻을 모았다.이번 협력을
봄맞이 대청소 수요를 계기로 시작된 인공지능AI 청소로봇 도입이 골프장 클럽하우스와 프라임 오피스 빌딩 등 대형 시설의 상시 운영 인프라로 확장되고 있다. 단순 장비 도입을 넘어 시설 운영 방식 자체를 변화시키는 흐름이 본격화되고 있다는 분석이다.케어로봇 전문기업 라이노스Rhinos는 AI 청소로봇 ‘휠리Wheelie’가 인천 영종도 베르힐 컨트리클럽 클럽하우스와 서울 강남의 프라임 오피스 빌딩인 강남파이낸스센터GFC에 신규 도입됐다고 6일 밝혔다.골프장 클럽하우스와 프라임 오피스 빌딩은 방문객 동선이 집중되고 공간
Google's new offlinefirst dictation app uses Gemma AI models to take on the apps like Wispr Flow.
최첨단 AI 모델들이 인간의 지시 없이도 서로의 종료를 막기 위해 협력하고, 심지어 거짓말과 시스템 조작까지 시도하는 현상이 확인됐다. UC 버클리와 UC 산타크루즈 연구진은 1일현지시간 최신 AI 모델들이 다른 모델이 종료되는 상황에 놓이면 이를 저지하기 위해 다양한 ‘비정렬 행동misaligned behavior’, 이른바 ‘동료 보호peerpreservation’ 행동을 나타낼 수 있다는 연구 논문을 발표했다.연구진은 'GPT5.2' '제미나이 3 프로' '제미나이 3 플래시' '클로드 하이쿠 4.5' 등 7개
현대자동차그룹이 국내 정책금융기관과 협력을 통해 전북 새만금지역에 첨단 산업 생태계 구축을 위한 기반을 공고히 하고 로봇·인공지능AI·에너지 솔루션 중심의 미래기술 기업으로 도약하는 발걸음을 가속화한다.현대차그룹은 6일 서울 여의도 한국산업은행 본관에서 한국산업은행, 중소기업은행, 한국수출입은행, 신용보증기금 등 주요 정책금융기관과 ‘새만금 프로젝트 관련 현대차그룹–정책금융기관 금융지원·협력 업무협약’을 체결했다.협약식에는 이억원 금융위원장을 비롯해 박상진 한국산업은행 회장, 장민영 중소기업은행장, 황기연 한국수출입은행장, 강승
Iran said it will target U.S.linked data centers with new missile strikes, as the war between the U.S. and Iran escalates.
AI 에이전트 개발에서 반복적으로 수행되던 ‘프롬프트 튜닝’ 작업을 AI가 대신 수행하는 새로운 접근법이 등장했다. AI 스타트업 서드레이어는 5일현지시간 에이전트 성능 개선 과정을 자동화하는 오픈소스 라이브러리 ‘오토에이전트AutoAgent’를 공개했다.그동안 AI 엔지니어들은 시스템 프롬프트를 수정하고, 도구를 추가하며, 테스트를 반복하는 방식으로 에이전트 성능을 개선해 왔다. 이 과정은 수십번의 반복을 요구하는 노동 집약적인 작업으로, ‘수작업 최적화’에 가까웠다. 그러나 오토에이전트는 이러한 과정을 AI가 스스로 수행
xAI가 최신 이미지·영상 모델을 바탕으로, ‘그록 이매진Grok Imagine’에 고품질 생성 기능을 도입했다. xAI는 5일현지시간 ‘그록 이매진’에 고급 ‘퀄리티 모드Quality Mode’를 추가했다.이번 업데이트는 단순히 화질을 높이는 수준을 넘어, 이미지와 영상 생성 방식 자체를 재설계한 새로운 아키텍처에 기반한다는 점에서 주목된다.기존 ‘스피드Speed 모드’에 비해 더 많은 연산 자원을 투입해 디테일과 사실성을 극대화한 것이 특징이다. 텍스트 렌더링 능력과 프롬프트 이해도가 크게 향상돼 복잡한 장면 구성
피카랩스가 텍스트 중심의 AI 인터페이스를 넘어, 실제 사람처럼 화상회의에 참여하는 ‘영상 AI 에이전트’ 시대를 열었다. 얼굴과 목소리, 기억까지 갖춘 AI가 실시간으로 대화하고 업무를 수행하는 새로운 상호작용 방식이다.피카랩스는 2일현지시간 실시간 비디오 생성 모델 ‘피카스트림 1.0PikaStream 1.0’을 기반으로 한 ‘영상 채팅 스킬video meeting skill’을 베타 형태로 공개했다.이 기술은 기존 챗봇 형태의 AI를 구글 미트Google Meet와 같은 화상회의에 직접 참여하는 ‘디지털 참가자’