Publications
Year
2026
ELSEVIER
Year
2025
NeurIPS
MLIR-ARX: Accelerator-Aware MLIR-to-RISC-V Compilation Integrated with an EDA Flow
NeurIPS
A NUMA Aware Compiler Framework for Large Scale Mathematical Reasoning Inference on PCIe Based Multi Accelerator Systems
IEEE
Target-Aware Neural Network Execution via Compiler-Guided Pruning
KIPS
K-Means Clustering 기반 온디바이스를 위한 효율적인 얼굴 인식 알고리즘
ICCVW
Design Practices and Lessons from Deploying On-device Vision-Language Interaction in Robotic Guide Dogs
ICCVW
TriPlanNet: Triangle Path Planning Network for A Variable Truss Robot with Deep Learning
CASES
Luthier: Bridging Auto-Tuning and Vendor Libraries for Efficient Deep Learning Inference
CASES
I-FlashAttention: Fully Integer Fused Attention for Efficient Vision Transformers
IJCAI
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant
LCTES
Multi-level Machine Learning-Guided Autotuning for Efficient Code Generation on a Deep Learning Accelerator
대한임베디드공학회
NPU 시스템 확장을 위한 데이터 전송 최적화
KIPS
라즈베리파이 5와 Hailo-8 및 8L의 AI 연산 성능 비교를 통한 엣지 디바이스 성능 향상 방안 연구
ELSEVIER BV
QuantuneV2: Compiler-based local metric-driven mixed precision quantization for practical embedded AI applications
한국정보처리학회
온디바이스 AI 기반 자율 이동형 감시 로봇 개발
CGO
Dynamic Layer-Specific Overlapping for Efficient LLM Inference on Resource-Constrained Systems
SENSORS
Optimizing Real-Time Object Detection in a Multi-Neural Processing Unit System
CGO
A Lightweight Deep Learning Backend for Edge Devices Optimized for Limited C Library Environments
Year
2024
NeurIPS 2024
ML2Tuner: Efficient Code Tuning via Multi-Level Machine Learning Models
AIComps 2024
Optimizing Real-Time Object Detection in a Multi NPU System with Double Buffering and Queue-Based Processing
IEEE IoT Journal
Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT Systems
대한임베디드공학회 2024
PCIe 기반 다중 NPU 데이터 전송 최적화
대한임베디드공학회 2024
이종시스템상에서의 모델 분할 기반 DNN 처리량 평가
대한임베디드공학회 2024
임베디드 시스템에서 권한 제한을 통한 가상 컨테이너 활용 방안
IROS 2024
Visual Preference Inference: An Image Sequence-Based Preference Reasoning in Tabletop Object Manipulation
ETRI Journal
NEST-C: A Deep Learning Compiler Framework for Heterogeneous Computing Systems with Artificial Intelligence Accelerators
ECCV 2024
Mixed Non-linear Quantization for Vision Transformers
IJCAI 2024
LLMem: Estimating GPU Memory Usage for Fine-Tuning Pre-Trained LLMs
ICRA 2024
Visual Preference Inference: An Image Sequence-Based Preference Reasoning in Tabletop Object Manipulation
전자공학회논문지
엣지 딥 러닝 가속기의 추론 성능 분석
Year
2023
NeurIPS 2023
ACLTuner: A Profiling-Driven Fast Tuning to Optimized Deep Learning Inference
전자공학회논문지
범용 AI 컴파일러의 비공개 NPU 코드생성을 위한 공통 인터페이스 설계 및 검증
전자공학회논문지
이기종 멀티코어 CPU에서 프로파일 기반 딥 러닝 연산 최적화 기법
JPDC
Tensor Slicing and Optimization for Multicore NPUs
ETRI Journal
PartitionTuner: An Operator Scheduler for Deep-Learning Compilers Supporting Multiple Heterogeneous Processing Units
한국통신학회 2023
그래프 엣지 정보를 활용한 한국어 서술형 수학 문제 풀이 성능 개선 연구
한국통신학회 2023
이기종 컴퓨팅과 복수 신경망 추론 환경에서 높은 처리량을 위한 스케줄러 관한 연구
Year
2022
대한전자공학회 2022
단일 ISA 이기종 멀티 코어 구조를 위한 프로파일 기반 ArmCL 최적 스케줄 탐색
ECCV 2022
CPrune: Compiler-Informed Model Pruning for Efficient Target-Aware DNN Execution
FGCS
Quantune: Post-training Quantization of Convolutional Neural Networks using Extreme Gradient Boosting for Fast Deployment
Year
2021
대한임베디드공학회
이종 프로세싱 유닛 상에서의 분기 병렬 실행을 통한 뉴럴넷 계산 성능 향상
대한임베디드공학회
Glow 컴파일러 확장을 통한 혼합정밀도 양자화
대한임베디드공학회
확장 가능한 HLS 기반 딥러닝 가속 하드웨어 개발
Year
2020
대한임베디드공학회
NPU를 위한 연산자 퓨전 기반 양자화 신경망 모델의 정확도 향상
한국컴퓨터종합학술대회
임베디드 디바이스를 위한 딥뉴럴넷 C/C++ 코드 자동 생성 프레임워크
ISET
Glow 컴파일러 기반 타겟에 독립적인 연산자 퓨전을 활용한 CNN 추론 가속화
ISET
다중 가속기 지원 딥러닝 컴파일러를 위한 프로파일링 기반 그래프 파티셔닝 시스템
한국컴퓨터종합학술대회
Glow 컴파일러를 활용한 CPU상에서의 물체 탐지 가속화 연구
ISET
HLS 기반 딥러닝 가속 하드웨어의 ISA 확장을 통한 성능 향상
한국컴퓨터종합학술대회