Publications

Year

2026

IEMEK

Conference

비동기 큐 파이프라인 기법을 통한 임베디드 환경에서 추론 처리량 개선

조현준, 이지호, 이지원, 김진목, 차주형, 권용인

ISET 2026 | Edge AI · NPU · Asynchronous Queue

ELSEVIER

Journal

Towards an efficient dataflow-flexible accelerator by finding optimal dataflows of DNNs

Hyunjun Kim, Whoi Ree Ha, Yongseok Lee, Dongju Lee, Jongwon Lee, Deumji Woo, Jonghee Yoon, Jemin Lee, Yongin Kwon, Yunheung Paek

ELSEVIER | Architecture

Year

2025

NeurIPS

Workshop

MLIR-ARX: Accelerator-Aware MLIR-to-RISC-V Compilation Integrated with an EDA Flow

Yongin Kwon, Joohyoung Cha

Conference on Neural Information Processing Systems (NeurIPS) 2025 Workshop | Compiler · MLIR · RISC-V

NeurIPS

Workshop

A NUMA Aware Compiler Framework for Large Scale Mathematical Reasoning Inference on PCIe Based Multi Accelerator Systems

JooHyoung Cha, Yongin Kwon

Conference on Neural Information Processing Systems (NeurIPS) 2025 Workshop | NUMA · Multi-Accelerator · Compiler

IEEE

Journal

Target-Aware Neural Network Execution via Compiler-Guided Pruning

JooHyoung Cha, Taeho Kim, Jemin Lee, Sangtae Ha, Yongin Kwon

IEEE Transactions on Mobile Computing | Compiler Optimization · Model Pruning

KIPS

Conference

K-Means Clustering 기반 온디바이스를 위한 효율적인 얼굴 인식 알고리즘

조현준, 양병찬, 차주형, 권용인

한국정보처리학회 학술 발표 대회 (추계) 2025 | On-device AI · Face Recognition

ICCVW

Workshop

Design Practices and Lessons from Deploying On-device Vision-Language Interaction in Robotic Guide Dogs

Jinse Kwon, Jemin Lee, Yongin Kwon

International Conference on Computer Vision Workshops (ICCVW) 2025 | Vision-Language Model · Robotics

ICCVW

Workshop

TriPlanNet: Triangle Path Planning Network for A Variable Truss Robot with Deep Learning

Choonghan Lee, Leah Harris, Sehyun Oh, JooHyoung Cha, Jemin Lee, Yongin Kwon, Andrew Jang-ho Bae

International Conference on Computer Vision Workshops (ICCVW) 2025 | Path Planning · Deep Learning

CASES

Conference

Luthier: Bridging Auto-Tuning and Vendor Libraries for Efficient Deep Learning Inference

Yongin Kwon, Joohyoung Cha, Sehyeon Oh, Misun Yu, Jeman Park, Jemin Lee

International Conference on Compilers, Architecture, and Synthesis for Embedded Systems (CASES) 2025 | Auto-Tuning · Deep Learning Inference

CASES

Conference

I-FlashAttention: Fully Integer Fused Attention for Efficient Vision Transformers

Sehyeon Oh, Yongin Kwon, Jemin Lee

International Conference on Compilers, Architecture, and Synthesis for Embedded Systems (CASES) 2025 | Quantization · Vision Transformer

IJCAI

Conference

Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant

Jemin Lee, Sihyeong Park, Jinse Kwon, Jihun Oh, Yongin Kwon

International Joint Conference on Artificial Intelligence (IJCAI) 2025 | LLM · Quantization

LCTES

Conference

Multi-level Machine Learning-Guided Autotuning for Efficient Code Generation on a Deep Learning Accelerator

JooHyoung Cha, Munyoung Lee, Jinse Kwon, Jemin Lee, Yongin Kwon

ACM SIGPLAN/SIGBED Conference on Languages, Compilers and Tools for Embedded Systems (LCTES) 2025 | ML-Guided Autotuning · Accelerator

대한임베디드공학회

Journal

NPU 시스템 확장을 위한 데이터 전송 최적화

오세현, 권용인, 이제민

대한임베디드공학회논문지 2025 | NPU · Data Transfer Optimization

KIPS

Conference

라즈베리파이 5와 Hailo-8 및 8L의 AI 연산 성능 비교를 통한 엣지 디바이스 성능 향상 방안 연구

양병찬, 오세현, 차주형, 이제민, 권용인

한국정보처리학회 학술 발표 대회 (추계) 2025 | Edge AI · Performance Evaluation

ELSEVIER BV

Journal

QuantuneV2: Compiler-based local metric-driven mixed precision quantization for practical embedded AI applications

Jeongseok Kim, Jemin Lee, Yongin Kwon, Daeyoung Kim

Elseivier/Future Generation Computer Systems | Computational Efficiency · Model performance

한국정보처리학회

Conference

온디바이스 AI 기반 자율 이동형 감시 로봇 개발

조현준, 김태훈, 강신재, 차주형, 이충한, 권용인

한국정보처리학회 학술 발표 대회 (춘계) 2025 | On-device AI · Face Recognition

CGO

Conference

Dynamic Layer-Specific Overlapping for Efficient LLM Inference on Resource-Constrained Systems

Misun Yu, Jeman Park, Jemin Lee, Jinse Kwon, Yongin Kwon

IEEE/ACM International Symposium on Code Generation and Optimization (CGO) 2025 | LLM Inference · Systems Optimization

SENSORS

journal

Optimizing Real-Time Object Detection in a Multi-Neural Processing Unit System

Sehyeon Oh, Yongin Kwon, Jemin Lee

MDPI/Multidisciplinary Digital Publishing Institute | Detection Systems · Hardware accelerator

CGO

Conference

A Lightweight Deep Learning Backend for Edge Devices Optimized for Limited C Library Environments

Jeman Park, Misun Yu, Jemin Lee, Jinse Kwon, Yongin Kwon

International Symposium on Code Generation and Optimization (CGO) 2025 | Edge devices · deep learning

Year

2024

NeurIPS 2024

Workshop

ML2Tuner: Efficient Code Tuning via Multi-Level Machine Learning Models

JooHyoung Cha, Munyoung Lee, Jinse Kwon, Jubin Lee, Jemin Lee, Yongin Kwon

Conference on Neural Information Processing Systems (NeurIPS) 2024 Workshop | Compiler · Auto-Tuning

AIComps 2024

Conference

Optimizing Real-Time Object Detection in a Multi NPU System with Double Buffering and Queue-Based Processing

Sehyeon Oh, Yongin Kwon, Jemin Lee

International Conference on Artificial Intelligence Computing and Systems (AIComps) 2024 | NPU · Real-Time Systems

IEEE IoT Journal

Journal

Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT Systems

Jemin Lee, Yongin Kwon, Sihyeong Park, Misun Yu, Jeman Park, Hwanjun Song

IEEE Internet of Things Journal 2024 | Quantization · Vision Transformer

대한임베디드공학회 2024

Conference

PCIe 기반 다중 NPU 데이터 전송 최적화

오세현, 권용인, 이제민

대한임베디드공학회 학술 대회 (추계) 2024 | NPU · Data Transfer

대한임베디드공학회 2024

Conference

이종시스템상에서의 모델 분할 기반 DNN 처리량 평가

유미선, 오세현, 권용인

대한임베디드공학회 학술 대회 (추계) 2024 | Heterogeneous Systems · DNN

대한임베디드공학회 2024

Conference

임베디드 시스템에서 권한 제한을 통한 가상 컨테이너 활용 방안

차주형, 권용인

대한임베디드공학회 학술 대회 (추계) 2024 | Embedded Systems · Virtualization

IROS 2024

Conference

Visual Preference Inference: An Image Sequence-Based Preference Reasoning in Tabletop Object Manipulation

Joonhyung Lee, Sangbeom Park, Yongin Kwon, Jemin Lee, Minwook Ahn, Sungjoon Choi

International Conference on Intelligent Robots and Systems (IROS) 2024 | Robotics · Preference Learning

ETRI Journal

Journal

NEST-C: A Deep Learning Compiler Framework for Heterogeneous Computing Systems with Artificial Intelligence Accelerators

Jeman Park, Misun Yu, Jinse Kwon, Junmo Park, Jemin Lee, Yongin Kwon

ETRI Journal 2024 | Compiler Framework · Heterogeneous Systems

ECCV 2024

Conference

Mixed Non-linear Quantization for Vision Transformers

Gihwan Kim, Jemin Lee, Sihyeong Park, Yongin Kwon, Hyungshin Kim

European Conference on Computer Vision (ECCV) 2024 | Quantization · Vision Transformer

IJCAI 2024

Conference

LLMem: Estimating GPU Memory Usage for Fine-Tuning Pre-Trained LLMs

Taeho Kim, Yanming Wang, Vatshank Chaturvedi, Lokesh Gupta, Seyeon Kim, Yongin Kwon, Sangtae Ha

International Joint Conference on Artificial Intelligence (IJCAI) 2024 | LLM · Memory Optimization

ICRA 2024

Workshop

Visual Preference Inference: An Image Sequence-Based Preference Reasoning in Tabletop Object Manipulation

Joonhyung Lee, Sangbeom Park, Yongin Kwon, Jemin Lee, Minwook Ahn, Sungjoon Choi

International Conference on Robotics and Automation (ICRA) 2024 Workshop | Robotics · Preference Learning

전자공학회논문지

Journal

엣지 딥 러닝 가속기의 추론 성능 분석

박시형, 권용인, 이제민

전자공학회논문지 2024 | Edge AI · Accelerator Analysis

Year

2023

NeurIPS 2023

Workshop

ACLTuner: A Profiling-Driven Fast Tuning to Optimized Deep Learning Inference

Yongin Kwon, Joo Hyoung Cha, Jubin Lee, Misun Yu, Jeman Park, Jemin Lee

Conference on Neural Information Processing Systems (NeurIPS) 2023 Workshop | Auto-Tuning · Deep Learning Inference

전자공학회논문지

Journal

범용 AI 컴파일러의 비공개 NPU 코드생성을 위한 공통 인터페이스 설계 및 검증

이제민, 권용인

전자공학회논문지 2023 | Compiler · NPU Interface

전자공학회논문지

Journal

이기종 멀티코어 CPU에서 프로파일 기반 딥 러닝 연산 최적화 기법

차주형, 권용인, 이제민

전자공학회논문지 2023 | Multicore Optimization · Profiling

JPDC

Journal

Tensor Slicing and Optimization for Multicore NPUs

Rafael Sousa, Marcio Pereira, Yongin Kwon, Taeho Kim, Namsoon Jung, Chang Soo Kim, Michael Frank, Guido Araujo

Journal of Parallel and Distributed Computing 2023 | Tensor Optimization · NPU

ETRI Journal

Journal

PartitionTuner: An Operator Scheduler for Deep-Learning Compilers Supporting Multiple Heterogeneous Processing Units

Misun Yu, Yongin Kwon, Jemin Lee, Jeman Park, Junmo Park, Taeho Kim

ETRI Journal 2023 | Compiler Scheduler · Heterogeneous Systems

한국통신학회 2023

Conference

그래프 엣지 정보를 활용한 한국어 서술형 수학 문제 풀이 성능 개선 연구

여상엽, 박제만, 권용인

한국통신학회 종합 학술 발표회 (동계) 2023 | Graph Learning · NLP

한국통신학회 2023

Conference

이기종 컴퓨팅과 복수 신경망 추론 환경에서 높은 처리량을 위한 스케줄러 관한 연구

차주형, 박제만, 권용인

한국통신학회 종합 학술 발표회 (동계) 2023 | Heterogeneous Computing · Scheduling

Year

2022

대한전자공학회 2022

Conference

단일 ISA 이기종 멀티 코어 구조를 위한 프로파일 기반 ArmCL 최적 스케줄 탐색

차주형, 이주빈, 권용인

대한전자공학회 학술 대회 (추계) 2022 | Profiling · Scheduling · ArmCL

ECCV 2022

Conference

CPrune: Compiler-Informed Model Pruning for Efficient Target-Aware DNN Execution

Taeho Kim, Yongin Kwon, Jemin Lee, Taeho Kim, Sangtae Ha

European Conference on Computer Vision (ECCV) 2022 | Compiler-Informed Pruning · Efficient DNN

FGCS

Journal

Quantune: Post-training Quantization of Convolutional Neural Networks using Extreme Gradient Boosting for Fast Deployment

Jemin Lee, Misun Yu, Yongin Kwon, Taeho Kim

Future Generation Computer Systems 2022 | Post-training Quantization · CNN

Year

2021

대한임베디드공학회

Conference

이종 프로세싱 유닛 상에서의 분기 병렬 실행을 통한 뉴럴넷 계산 성능 향상

유미선, 권용인, 이제민, 박제만, 김태호

대한임베디드공학회 학술 대회 (추계) 2021 | Parallel Execution · Neural Network Acceleration

대한임베디드공학회

Conference

Glow 컴파일러 확장을 통한 혼합정밀도 양자화

이제민, 유미선, 권용인, 박제만, 김태호

대한임베디드공학회 학술 대회 (추계) 2021 | Compiler Extension · Mixed-Precision Quantization

대한임베디드공학회

Conference

확장 가능한 HLS 기반 딥러닝 가속 하드웨어 개발

권용인, 유미선, 박제만, 이제민, 김태호

대한임베디드공학회 학술 대회 (추계) 2021 | HLS · Deep Learning Accelerator

Year

2020

대한임베디드공학회

Conference

NPU를 위한 연산자 퓨전 기반 양자화 신경망 모델의 정확도 향상

이제민, 유미선, 권용인, 김영주, 김태호

대한임베디드공학회 학술 대회 (추계) 2020 | Operator Fusion · Quantization

한국컴퓨터종합학술대회

Conference

임베디드 디바이스를 위한 딥뉴럴넷 C/C++ 코드 자동 생성 프레임워크

유미선, 이제민, 권용인, 김영주, 김태호

한국 컴퓨터 종합 학술 대회 2020 | Code Generation · Embedded AI

ISET

Conference

Glow 컴파일러 기반 타겟에 독립적인 연산자 퓨전을 활용한 CNN 추론 가속화

이제민, 유미선, 권용인, 김영주, 김태호

IEMEK Symposium on Embedded Technology (ISET) 2020 | Operator Fusion · CNN Acceleration

ISET

Conference

다중 가속기 지원 딥러닝 컴파일러를 위한 프로파일링 기반 그래프 파티셔닝 시스템

유미선, 권용인, 이제민, 김영주, 김태호

IEMEK Symposium on Embedded Technology (ISET) 2020 | Profiling · Graph Partitioning

한국컴퓨터종합학술대회

Conference

Glow 컴파일러를 활용한 CPU상에서의 물체 탐지 가속화 연구

이제민, 권용인, 유미선, 김영주, 김태호

한국 컴퓨터 종합 학술 대회 2020 | Compiler Optimization · Object Detection

ISET

Conference

HLS 기반 딥러닝 가속 하드웨어의 ISA 확장을 통한 성능 향상

권용인, 김영주, 유미선, 이제민, 김태호

IEMEK Symposium on Embedded Technology (ISET) 2020 | HLS · ISA Extension

한국컴퓨터종합학술대회

Conference

타일링과 스케줄링: 딥러닝 가속 하드웨어의 실행 코드 최적화

권용인, 김영주, 유미선, 이제민, 김태호

한국 컴퓨터 종합 학술 대회 2020 | Tiling · Scheduling Optimization