매칭 진행 중

·

ID

30053

대규모 비전·멀티모달 AI의 추론 비용 절감을 위한 적응형 토큰 축소 기술 개발

기업 용역

정부 지원 과제

기술 이전

을 함께 진행할

기업

을 찾는 공고입니다.

본 연구는 대규모 Vision 및 멀티모달 AI 모델의 추론 비용을 획기적으로 절감할 수 있는 적응형 토큰 축소(Adaptive Token Reduction) 기술을 개발하고자 합니다. 모델 구조 변경이나 재학습 없이, 추론 단계에서 입력 토큰의 중요도를 동적으로 분석하여 불필요한 토큰을 제거 또는 병합함으로써 연산량과 지연시간을 줄이는 경량화 기법을 제안합니다. 입력 난이도나 시스템 리소스 상황에 따라 토큰 수를 실시간으로 조절할 수 있어, 모바일·엣지 환경이나 대규모 비전 서비스에 즉시 적용 가능한 실용적 경량화 기술을 목표로 합니다.

게시자 유형

연구실

핵심 키워드

Token Reduction

Vision Transformer

추론 최적화

과제 규모

공고 마감일

연구실 소개

연구실 소개

인하대학교 빅데이터 연구실은 최동완 교수를 중심으로 인간 중심 인공지능 기술, 특히 지속학습 기반 시스템을 연구하고 있습니다. 연구실은 ‘Deep Total Recall’이라는 정부 대형과제를 수행 중이며, 인간 기억처럼 회상이 가능한 인공지능 신경망을 설계하고 실증하는 데 주력하고 있습니다. 실제 치매 환자를 위한 AI 반려로봇 시제품을 개발해 병원·요양기관 등과 연계한 실증 실험까지 진행한 실전형 연구실입니다. 멀티모달 AI, LLM 기반 질의응답, 사용자 맞춤형 인터랙션 기술을 통합하는 기술 역량을 바탕으로, 사회적 약자 대상의 AI 서비스 기술 실증과 사업화를 병행하고 있습니다.

대표 연구 분야

1. 인간 기억 메커니즘 기반 지속학습 인공지능 설계 - 인간의 기억이 단순 저장이 아닌 재구성 과정임에 착안하여, 점진적 학습과 회상 기반 지식 표현 방식을 결합한 인공지능 모델을 설계합니다. 기존 지속학습 기술의 치명적 망각 문제를 해결하고, 과거 경험을 유연하게 활용 가능한 신경망 구조를 구현합니다. 2. 멀티모달 기반 사용자 맞춤형 회상 유도 시스템 - 이미지와 음성을 인식하고, 개인화된 질문을 생성하여 회상을 유도하는 인간 친화형 인터랙션 시스템을 개발합니다. 사용자 제공 사진/물체 정보를 기반으로 LLM을 활용한 맞춤형 질문을 생성하고, 환자의 음성 응답을 자동 분석·학습하는 기능을 포함합니다. 3. 치매 회상치료 응용을 위한 AI 반려로봇 실증 연구 - 회상 유도 인공지능을 반려로봇에 탑재하여, 치매 환자 대상 디지털 치료제로서의 가능성을 실증합니다. 시제품 개발(v0.2) 및 사용자 테스트를 기반으로 회상치료 효과를 검증하며, 병원·로봇 전문가와 협업하여 실제 환경 적용을 목표로 기술 고도화를 진행 중입니다.

정부과제 / 산학협력 경험

- IITP '사람 중심 인공지능 핵심원천기술개발사업' 대형과제(2022~2026, 총 50억) 수행 - Vision Transformer 기반 토큰 병합 기술에 관한 국제 학회(ECAI 등) 논문 발표 경험 - Training-free 추론 최적화 및 실시간 연산 제어 관련 산업 친화적 연구 성과 축적

연구 희망 개요

연구 희망 및 관심 주제

대규모 비전 및 멀티모달 AI 모델의 추론 최적화를 위한 적응형 토큰 축소 기술 개발 본 연구는 추론 단계에서 입력 토큰의 중요도를 동적으로 평가하고, 중요도가 낮은 토큰을 병합하거나 제거하는 방식으로 성능 저하 없이 연산량을 줄이는 기술을 개발합니다. 모델 구조 변경이나 재학습 없이 적용 가능하며, 입력 난이도 및 시스템 자원 상황에 따라 유연하게 토큰 수를 조절할 수 있어 다양한 산업 환경에서의 활용 가능성이 높습니다.

협력 가능 분야

- 비전/멀티모달 AI 모델 적용 중인 제품·서비스 실증 협력 - PoC 및 실사용 환경 내 성능 비교 실험 - 경량화 기술 요구사항 정리 및 기술 적용 기획 - 공동 특허 출원 및 기술 사업화 전략 수립

본 연구 관련 연구실 특장점

- Vision Transformer 기반 토큰 축소 및 병합 관련 국제 학회 발표 경험 - 모델 재학습 없이 실시간 토큰 제어가 가능한 Training-free 추론 최적화 기술 보유 - 모바일·엣지·클라우드 환경 적용을 고려한 실용적 기술 지향 - 다양한 AI 모델 및 시스템과의 연동 가능성을 염두에 둔 확장성 높은 설계

협업 요건

파트너 기대 역할

기업 역할 - 현업에서 활용 중인 AI 모델 및 서비스 환경 제공 - 경량화 기술 도입에 필요한 요구사항 정의 - 실사용 테스트 환경에서 PoC 및 성능 검증 - 특허 공동 출원 및 기술 이전·상용화 검토 연구실 역할 - 적응형 토큰 축소 기술의 설계 및 알고리즘 구현 - 성능 분석 및 기존 모델 대비 최적화 평가 - 실제 적용 환경 기반의 커스터마이징 지원

협업 파트너 희망 요건

- AI 솔루션, 비전 AI, 멀티모달 AI, 모바일·엣지 AI 관련 기업 - 대규모 AI 모델 운영 또는 시스템 적용 경험 보유 - 기술이전, 공동개발 또는 PoC 검증에 의지가 있는 파트너

대표 장재우,이윤구 서울특별시 강남구 테헤란로 431, 저스트코타워 4층 대표 전화 010-6312-6417 이메일 info@rndcircle.io

사업자등록번호 458-87-03380 호스팅제공자 아마존 웹 서비스(AWS)

© 2025 RnDcircle. All Rights Reserved.

회사

서비스

문의

블로그

이용하기