Publications

Year
2026
ELSEVIER
Journal

Towards an efficient dataflow-flexible accelerator by finding optimal dataflows of DNNs

Hyunjun Kim, Whoi Ree Ha, Yongseok Lee, Dongju Lee, Jongwon Lee, Deumji Woo, Jonghee Yoon, Jemin Lee, Yongin Kwon, Yunheung Paek

ELSEVIER | Architecture
Year
2025
NeurIPS
Workshop

MLIR-ARX: Accelerator-Aware MLIR-to-RISC-V Compilation Integrated with an EDA Flow

Yongin Kwon, Joohyoung Cha

Conference on Neural Information Processing Systems (NeurIPS) 2025 Workshop | Compiler · MLIR · RISC-V
NeurIPS
Workshop

A NUMA Aware Compiler Framework for Large Scale Mathematical Reasoning Inference on PCIe Based Multi Accelerator Systems

JooHyoung Cha, Yongin Kwon

Conference on Neural Information Processing Systems (NeurIPS) 2025 Workshop | NUMA · Multi-Accelerator · Compiler
IEEE
Journal

Target-Aware Neural Network Execution via Compiler-Guided Pruning

JooHyoung Cha, Taeho Kim, Jemin Lee, Sangtae Ha, Yongin Kwon

IEEE Transactions on Mobile Computing | Compiler Optimization · Model Pruning
KIPS
Conference

K-Means Clustering 기반 온디바이스를 위한 효율적인 얼굴 인식 알고리즘

조현준, 양병찬, 차주형, 권용인

한국정보처리학회 학술 발표 대회 (추계) 2025 | On-device AI · Face Recognition
ICCVW
Workshop

Design Practices and Lessons from Deploying On-device Vision-Language Interaction in Robotic Guide Dogs

Jinse Kwon, Jemin Lee, Yongin Kwon

International Conference on Computer Vision Workshops (ICCVW) 2025 | Vision-Language Model · Robotics
ICCVW
Workshop

TriPlanNet: Triangle Path Planning Network for A Variable Truss Robot with Deep Learning

Choonghan Lee, Leah Harris, Sehyun Oh, JooHyoung Cha, Jemin Lee, Yongin Kwon, Andrew Jang-ho Bae

International Conference on Computer Vision Workshops (ICCVW) 2025 | Path Planning · Deep Learning
CASES
Conference

Luthier: Bridging Auto-Tuning and Vendor Libraries for Efficient Deep Learning Inference

Yongin Kwon, Joohyoung Cha, Sehyeon Oh, Misun Yu, Jeman Park, Jemin Lee

International Conference on Compilers, Architecture, and Synthesis for Embedded Systems (CASES) 2025 | Auto-Tuning · Deep Learning Inference
CASES
Conference

I-FlashAttention: Fully Integer Fused Attention for Efficient Vision Transformers

Sehyeon Oh, Yongin Kwon, Jemin Lee

International Conference on Compilers, Architecture, and Synthesis for Embedded Systems (CASES) 2025 | Quantization · Vision Transformer
IJCAI
Conference

Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant

Jemin Lee, Sihyeong Park, Jinse Kwon, Jihun Oh, Yongin Kwon

International Joint Conference on Artificial Intelligence (IJCAI) 2025 | LLM · Quantization
LCTES
Conference

Multi-level Machine Learning-Guided Autotuning for Efficient Code Generation on a Deep Learning Accelerator

JooHyoung Cha, Munyoung Lee, Jinse Kwon, Jemin Lee, Yongin Kwon

ACM SIGPLAN/SIGBED Conference on Languages, Compilers and Tools for Embedded Systems (LCTES) 2025 | ML-Guided Autotuning · Accelerator
대한임베디드공학회
Journal

NPU 시스템 확장을 위한 데이터 전송 최적화

오세현, 권용인, 이제민

대한임베디드공학회논문지 2025 | NPU · Data Transfer Optimization
KIPS
Conference

라즈베리파이 5와 Hailo-8 및 8L의 AI 연산 성능 비교를 통한 엣지 디바이스 성능 향상 방안 연구

양병찬, 오세현, 차주형, 이제민, 권용인

한국정보처리학회 학술 발표 대회 (추계) 2025 | Edge AI · Performance Evaluation
ELSEVIER BV
Journal

QuantuneV2: Compiler-based local metric-driven mixed precision quantization for practical embedded AI applications

Jeongseok Kim, Jemin Lee, Yongin Kwon, Daeyoung Kim

Elseivier/Future Generation Computer Systems | Computational Efficiency · Model performance
한국정보처리학회
Conference

온디바이스 AI 기반 자율 이동형 감시 로봇 개발

조현준, 김태훈, 강신재, 차주형, 이충한, 권용인

한국정보처리학회 학술 발표 대회 (춘계) 2025 | On-device AI · Face Recognition
CGO
Conference

Dynamic Layer-Specific Overlapping for Efficient LLM Inference on Resource-Constrained Systems

Misun Yu, Jeman Park, Jemin Lee, Jinse Kwon, Yongin Kwon

IEEE/ACM International Symposium on Code Generation and Optimization (CGO) 2025 | LLM Inference · Systems Optimization
SENSORS
journal

Optimizing Real-Time Object Detection in a Multi-Neural Processing Unit System

Sehyeon Oh, Yongin Kwon, Jemin Lee

MDPI/Multidisciplinary Digital Publishing Institute | Detection Systems · Hardware accelerator
CGO
Conference

A Lightweight Deep Learning Backend for Edge Devices Optimized for Limited C Library Environments

Jeman Park, Misun Yu, Jemin Lee, Jinse Kwon, Yongin Kwon

International Symposium on Code Generation and Optimization (CGO) 2025 | Edge devices · deep learning
Year
2024
NeurIPS 2024
Workshop

ML2Tuner: Efficient Code Tuning via Multi-Level Machine Learning Models

JooHyoung Cha, Munyoung Lee, Jinse Kwon, Jubin Lee, Jemin Lee, Yongin Kwon

Conference on Neural Information Processing Systems (NeurIPS) 2024 Workshop | Compiler · Auto-Tuning
AIComps 2024
Conference

Optimizing Real-Time Object Detection in a Multi NPU System with Double Buffering and Queue-Based Processing

Sehyeon Oh, Yongin Kwon, Jemin Lee

International Conference on Artificial Intelligence Computing and Systems (AIComps) 2024 | NPU · Real-Time Systems
IEEE IoT Journal
Journal

Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT Systems

Jemin Lee, Yongin Kwon, Sihyeong Park, Misun Yu, Jeman Park, Hwanjun Song

IEEE Internet of Things Journal 2024 | Quantization · Vision Transformer
대한임베디드공학회 2024
Conference

PCIe 기반 다중 NPU 데이터 전송 최적화

오세현, 권용인, 이제민

대한임베디드공학회 학술 대회 (추계) 2024 | NPU · Data Transfer
대한임베디드공학회 2024
Conference

이종시스템상에서의 모델 분할 기반 DNN 처리량 평가

유미선, 오세현, 권용인

대한임베디드공학회 학술 대회 (추계) 2024 | Heterogeneous Systems · DNN
대한임베디드공학회 2024
Conference

임베디드 시스템에서 권한 제한을 통한 가상 컨테이너 활용 방안

차주형, 권용인

대한임베디드공학회 학술 대회 (추계) 2024 | Embedded Systems · Virtualization
IROS 2024
Conference

Visual Preference Inference: An Image Sequence-Based Preference Reasoning in Tabletop Object Manipulation

Joonhyung Lee, Sangbeom Park, Yongin Kwon, Jemin Lee, Minwook Ahn, Sungjoon Choi

International Conference on Intelligent Robots and Systems (IROS) 2024 | Robotics · Preference Learning
ETRI Journal
Journal

NEST-C: A Deep Learning Compiler Framework for Heterogeneous Computing Systems with Artificial Intelligence Accelerators

Jeman Park, Misun Yu, Jinse Kwon, Junmo Park, Jemin Lee, Yongin Kwon

ETRI Journal 2024 | Compiler Framework · Heterogeneous Systems
ECCV 2024
Conference

Mixed Non-linear Quantization for Vision Transformers

Gihwan Kim, Jemin Lee, Sihyeong Park, Yongin Kwon, Hyungshin Kim

European Conference on Computer Vision (ECCV) 2024 | Quantization · Vision Transformer
IJCAI 2024
Conference

LLMem: Estimating GPU Memory Usage for Fine-Tuning Pre-Trained LLMs

Taeho Kim, Yanming Wang, Vatshank Chaturvedi, Lokesh Gupta, Seyeon Kim, Yongin Kwon, Sangtae Ha

International Joint Conference on Artificial Intelligence (IJCAI) 2024 | LLM · Memory Optimization
ICRA 2024
Workshop

Visual Preference Inference: An Image Sequence-Based Preference Reasoning in Tabletop Object Manipulation

Joonhyung Lee, Sangbeom Park, Yongin Kwon, Jemin Lee, Minwook Ahn, Sungjoon Choi

International Conference on Robotics and Automation (ICRA) 2024 Workshop | Robotics · Preference Learning
전자공학회논문지
Journal

엣지 딥 러닝 가속기의 추론 성능 분석

박시형, 권용인, 이제민

전자공학회논문지 2024 | Edge AI · Accelerator Analysis
Year
2023
NeurIPS 2023
Workshop

ACLTuner: A Profiling-Driven Fast Tuning to Optimized Deep Learning Inference

Yongin Kwon, Joo Hyoung Cha, Jubin Lee, Misun Yu, Jeman Park, Jemin Lee

Conference on Neural Information Processing Systems (NeurIPS) 2023 Workshop | Auto-Tuning · Deep Learning Inference
전자공학회논문지
Journal

범용 AI 컴파일러의 비공개 NPU 코드생성을 위한 공통 인터페이스 설계 및 검증

이제민, 권용인

전자공학회논문지 2023 | Compiler · NPU Interface
전자공학회논문지
Journal

이기종 멀티코어 CPU에서 프로파일 기반 딥 러닝 연산 최적화 기법

차주형, 권용인, 이제민

전자공학회논문지 2023 | Multicore Optimization · Profiling
JPDC
Journal

Tensor Slicing and Optimization for Multicore NPUs

Rafael Sousa, Marcio Pereira, Yongin Kwon, Taeho Kim, Namsoon Jung, Chang Soo Kim, Michael Frank, Guido Araujo

Journal of Parallel and Distributed Computing 2023 | Tensor Optimization · NPU
ETRI Journal
Journal

PartitionTuner: An Operator Scheduler for Deep-Learning Compilers Supporting Multiple Heterogeneous Processing Units

Misun Yu, Yongin Kwon, Jemin Lee, Jeman Park, Junmo Park, Taeho Kim

ETRI Journal 2023 | Compiler Scheduler · Heterogeneous Systems
한국통신학회 2023
Conference

그래프 엣지 정보를 활용한 한국어 서술형 수학 문제 풀이 성능 개선 연구

여상엽, 박제만, 권용인

한국통신학회 종합 학술 발표회 (동계) 2023 | Graph Learning · NLP
한국통신학회 2023
Conference

이기종 컴퓨팅과 복수 신경망 추론 환경에서 높은 처리량을 위한 스케줄러 관한 연구

차주형, 박제만, 권용인

한국통신학회 종합 학술 발표회 (동계) 2023 | Heterogeneous Computing · Scheduling
Year
2022
대한전자공학회 2022
Conference

단일 ISA 이기종 멀티 코어 구조를 위한 프로파일 기반 ArmCL 최적 스케줄 탐색

차주형, 이주빈, 권용인

대한전자공학회 학술 대회 (추계) 2022 | Profiling · Scheduling · ArmCL
ECCV 2022
Conference

CPrune: Compiler-Informed Model Pruning for Efficient Target-Aware DNN Execution

Taeho Kim, Yongin Kwon, Jemin Lee, Taeho Kim, Sangtae Ha

European Conference on Computer Vision (ECCV) 2022 | Compiler-Informed Pruning · Efficient DNN
FGCS
Journal

Quantune: Post-training Quantization of Convolutional Neural Networks using Extreme Gradient Boosting for Fast Deployment

Jemin Lee, Misun Yu, Yongin Kwon, Taeho Kim

Future Generation Computer Systems 2022 | Post-training Quantization · CNN
Year
2021
대한임베디드공학회
Conference

이종 프로세싱 유닛 상에서의 분기 병렬 실행을 통한 뉴럴넷 계산 성능 향상

유미선, 권용인, 이제민, 박제만, 김태호

대한임베디드공학회 학술 대회 (추계) 2021 | Parallel Execution · Neural Network Acceleration
대한임베디드공학회
Conference

Glow 컴파일러 확장을 통한 혼합정밀도 양자화

이제민, 유미선, 권용인, 박제만, 김태호

대한임베디드공학회 학술 대회 (추계) 2021 | Compiler Extension · Mixed-Precision Quantization
대한임베디드공학회
Conference

확장 가능한 HLS 기반 딥러닝 가속 하드웨어 개발

권용인, 유미선, 박제만, 이제민, 김태호

대한임베디드공학회 학술 대회 (추계) 2021 | HLS · Deep Learning Accelerator
Year
2020
대한임베디드공학회
Conference

NPU를 위한 연산자 퓨전 기반 양자화 신경망 모델의 정확도 향상

이제민, 유미선, 권용인, 김영주, 김태호

대한임베디드공학회 학술 대회 (추계) 2020 | Operator Fusion · Quantization
한국컴퓨터종합학술대회
Conference

임베디드 디바이스를 위한 딥뉴럴넷 C/C++ 코드 자동 생성 프레임워크

유미선, 이제민, 권용인, 김영주, 김태호

한국 컴퓨터 종합 학술 대회 2020 | Code Generation · Embedded AI
ISET
Conference

Glow 컴파일러 기반 타겟에 독립적인 연산자 퓨전을 활용한 CNN 추론 가속화

이제민, 유미선, 권용인, 김영주, 김태호

IEMEK Symposium on Embedded Technology (ISET) 2020 | Operator Fusion · CNN Acceleration
ISET
Conference

다중 가속기 지원 딥러닝 컴파일러를 위한 프로파일링 기반 그래프 파티셔닝 시스템

유미선, 권용인, 이제민, 김영주, 김태호

IEMEK Symposium on Embedded Technology (ISET) 2020 | Profiling · Graph Partitioning
한국컴퓨터종합학술대회
Conference

Glow 컴파일러를 활용한 CPU상에서의 물체 탐지 가속화 연구

이제민, 권용인, 유미선, 김영주, 김태호

한국 컴퓨터 종합 학술 대회 2020 | Compiler Optimization · Object Detection
ISET
Conference

HLS 기반 딥러닝 가속 하드웨어의 ISA 확장을 통한 성능 향상

권용인, 김영주, 유미선, 이제민, 김태호

IEMEK Symposium on Embedded Technology (ISET) 2020 | HLS · ISA Extension
한국컴퓨터종합학술대회
Conference

타일링과 스케줄링: 딥러닝 가속 하드웨어의 실행 코드 최적화

권용인, 김영주, 유미선, 이제민, 김태호

한국 컴퓨터 종합 학술 대회 2020 | Tiling · Scheduling Optimization