{"id":23103889,"url":"https://github.com/moatifbutt/awesome-diffusion-eccv-2024","last_synced_at":"2026-01-18T08:33:33.263Z","repository":{"id":258693446,"uuid":"867820873","full_name":"moatifbutt/awesome-diffusion-ECCV-2024","owner":"moatifbutt","description":"List of diffusion papers accepted in ECCV 2024.","archived":false,"fork":false,"pushed_at":"2024-10-17T20:48:58.000Z","size":288,"stargazers_count":15,"open_issues_count":0,"forks_count":1,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-11-05T22:01:59.677Z","etag":null,"topics":["accepted-papers","diffusion","diffusion-models","eccv","eccv-2024","eccv2024","t2i","text-to-image"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/moatifbutt.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-10-04T19:36:26.000Z","updated_at":"2025-09-25T02:37:30.000Z","dependencies_parsed_at":"2024-10-20T06:40:26.008Z","dependency_job_id":null,"html_url":"https://github.com/moatifbutt/awesome-diffusion-ECCV-2024","commit_stats":null,"previous_names":["moatifbutt/awesome-diffusion-eccv-2024"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/moatifbutt/awesome-diffusion-ECCV-2024","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/moatifbutt%2Fawesome-diffusion-ECCV-2024","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/moatifbutt%2Fawesome-diffusion-ECCV-2024/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/moatifbutt%2Fawesome-diffusion-ECCV-2024/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/moatifbutt%2Fawesome-diffusion-ECCV-2024/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/moatifbutt","download_url":"https://codeload.github.com/moatifbutt/awesome-diffusion-ECCV-2024/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/moatifbutt%2Fawesome-diffusion-ECCV-2024/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":28534148,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-01-18T00:39:45.795Z","status":"online","status_checked_at":"2026-01-18T02:00:07.578Z","response_time":98,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["accepted-papers","diffusion","diffusion-models","eccv","eccv-2024","eccv2024","t2i","text-to-image"],"created_at":"2024-12-17T00:29:40.263Z","updated_at":"2026-01-18T08:33:33.231Z","avatar_url":"https://github.com/moatifbutt.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"# Diffusion papers in ECCV 2024\nList of papers accepted in ECCV 2024.\n\u003chr\u003e\n\n#### SMooDi: Stylized Motion Diffusion Model\nLei Zhong, Yiming Xie, Varun Jampani, Deqing Sun, Huaizu Jiang*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.12783)] [[Project](https://neu-vi.github.io/SMooDi/)] [[Code](https://github.com/neu-vi/SMooDi)] [[Slides](https://eccv.ecva.net/media/eccv-2024/Slides/1010.pdf)]\n\n#### SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion\nVikram Voleti*, Chun-Han Yao, Mark Boss, Adam Letts, David Pankratz, Dmitrii Tochilkin, Christian Laforte, Robin Rombach, Varun Jampani*\n\u003cbr\u003e ![Oral Badge](https://img.shields.io/badge/Oral-blue) [[arXiv](https://arxiv.org/abs/2403.12008)] [[Project](https://sv3d.github.io/)] [[Model](https://huggingface.co/stabilityai/sv3d)]\n\n#### EMDM: Efficient Motion Diffusion Model for Fast, High-Quality Human Motion Generation\nWenyang Zhou, Zhiyang Dou*, Zeyu Cao, Zhouyingcheng Liao, Jingbo Wang, Wenjia Wang, Yuan Liu, Taku Komura, Wenping Wang, Lingjie Liu\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2312.02256)] [[Project](https://frank-zy-dou.github.io/projects/EMDM/index.html)] [[Code](https://github.com/Frank-ZY-Dou/EMDM)] [[Demo Video](https://www.youtube.com/watch?v=1SyCXbnol_g\u0026ab_channel=FrankZhiyangDou)]\n\n#### Diffusion Bridges for 3D Point Cloud Denoising\nMathias Vogel Hüni, Keisuke Tateno, Marc Pollefeys, Federico Tombari, Marie-Julie Rakotosaona, Francis Engelmann*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2408.16325)] [[Project](https://p2p-bridge.github.io/)] [[Code](https://github.com/matvogel/P2P-Bridge)] [[Poster](https://p2p-bridge.github.io/static/images/poster.png)]\n\n#### VFusion3D: Learning Scalable 3D Generative Models from Video Diffusion Models\nJunlin Han*, Filippos Kokkinos, Philip Torr\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2403.12034)] [[Project](https://junlinhan.github.io/projects/vfusion3d.html)] [[Code](https://github.com/facebookresearch/vfusion3d)] [[Poster](https://junlinhan.github.io/projects/resources/paper16/vfusion3d_poster.pdf)] [[Huggingface Demo](https://huggingface.co/spaces/facebook/VFusion3D)]\n\n#### Beta-Tuned Timestep Diffusion Model\nTianyi Zheng*, Peng-Tao Jiang, Ben Wan, Hao Zhang, Jinwei Chen, Jia Wang*, Bo Li*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/00328.pdf)]\n\n#### Taming Latent Diffusion Model for Neural Radiance Field Inpainting\nChieh Hubert Lin*, Changil Kim, Jia-Bin Huang, Qinbo Li, Chih-Yao Ma, Johannes Kopf, Ming-Hsuan Yang, Hung-Yu Tseng\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2404.09995)] [[Project](https://hubert0527.github.io/MALD-NeRF/)]\n\n#### FreeInit: Bridging Initialization Gap in Video Diffusion Models\nTianxing Wu*, Chenyang Si, Yuming Jiang, Ziqi Huang, Ziwei Liu\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2312.07537)] [[Project](https://tianxingwu.github.io/pages/FreeInit/)] [[Code](https://github.com/TianxingWu/FreeInit)] [[Huggingface Demo](https://huggingface.co/spaces/TianxingWu/FreeInit)] [[Video](https://youtu.be/lS5IYbAqriI)]\n\n#### LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation\nYushi Lan, Fangzhou Hong, Shuai Yang, Shangchen Zhou, Xuyi Meng, Bo Dai, Xingang Pan, Chen Change Loy*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2403.12019)] [[Project](https://nirvanalan.github.io/projects/ln3diff/)] [[Code](https://github.com/NIRVANALAN/LN3Diff)] [[Gradio Demo](https://huggingface.co/spaces/yslan/LN3Diff_I23D)]\n\n#### UniDream: Unifying Diffusion Priors for Relightable Text-to-3D Generation\nZexiang Liu, Yangguang Li, Youtian Lin, Xin Yu, Sida Peng, Yan-Pei Cao, Xiaojuan Qi, Xiaoshui Huang, Ding Liang*, Wanli Ouyang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2312.08754)] [[Project](https://yg256li.github.io/UniDream/)] [[Code](https://github.com/YG256Li/UniDream)]\n\n#### FreeDiff: Progressive Frequency Truncation for Image Editing with Diffusion Models\nWei WU*, Qingnan Fan, Shuai Qin, Hong Gu, Ruoyu Zhao, Antoni Chan*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2404.11895)] [[Code](https://github.com/Thermal-Dynamics/FreeDiff)]\n\n#### Synchronous Diffusion for Unsupervised Smooth Non-Rigid 3D Shape Matching\nDongliang Cao*, Zorah Laehner, Florian Bernard\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.08244)]\n\n#### Diffusion Models for Open-Vocabulary Segmentation\nLaurynas Karazija*, Iro Laina, Andrea Vedaldi, Christian Rupprecht\n\u003cbr\u003e  ![Oral Badge](https://img.shields.io/badge/Oral-blue) [[arXiv](https://arxiv.org/abs/2306.09316)] [[Project](https://www.robots.ox.ac.uk/~vgg/research/ovdiff/)] [[Video](https://youtu.be/OSDtkp7Ta-8)]\n\n#### AccDiffusion: An Accurate Method for Higher-Resolution Image Generation\nZhihang Lin, Mingbao Lin, Meng Zhao, Rongrong Ji*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.10738)] [[Project](https://lzhxmu.github.io/accdiffusion/accdiffusion.html)] [[Code](https://github.com/lzhxmu/AccDiffusion)]\n\n#### Learning Differentially Private Diffusion Models via Stochastic Adversarial Distillation\nBochao Liu, Pengju Wang, Shiming Ge*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2408.14738)]\n\n#### Prompting Future Driven Diffusion Model for Hand Motion Prediction\nBowen Tang*, Kaihao Zhang*, Wenhan Luo*, Wei Liu, HONGDONG LI\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/01102.pdf)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/653.png?t=1725929440.8208065)] \n\n#### ColorPeel: Color Prompt Learning with Diffusion Models via Color and Shape Disentanglement\nMuhammad Atif Butt*, Kai Wang, Javier Vazquez-Corral, Joost van de Weijer\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.07197)] [[Project](https://moatifbutt.github.io/colorpeel/)] [[Code](https://github.com/moatifbutt/color-peel)] [[Poster](https://github.com/moatifbutt/color-peel/blob/main/assets/ECCV2024_ColorPeel_.pdf)]\n\n#### DiffiT: Diffusion Vision Transformers for Image Generation\nAli Hatamizadeh*, Jiaming Song, Guilin Liu, Jan Kautz, Arash Vahdat\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2312.02139)] [[Code](https://github.com/NVlabs/DiffiT)]\n\n#### MoE-DiffIR: Task-customized Diffusion Priors for Universal Compressed Image Restoration\nYulin Ren, Xin Li*, Bingchen Li, Xingrui Wang, Mengxi China Guo, Shijie Zhao, Li Zhang, Zhibo Chen*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.10833)] [[Project](https://renyulin-f.github.io/MoE-DiffIR.github.io/)] [[Code](https://github.com/renyulin-f/MoE-DiffIR)] [[Data](https://drive.google.com/drive/folders/1Kn8SjJWpHITHlg5kuL1Ur7Ml-WNJJ064)]\n\n#### MonoWAD: Weather-Adaptive Diffusion Model for Robust Monocular 3D Object Detection\nYoungmin Oh, Hyung-Il Kim, Seong Tae Kim*, Jung Uk Kim*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.16448)] [[Code](https://github.com/VisualAIKHU/MonoWAD)] [[Data](https://drive.google.com/file/d/1iOpoZ-QbJdU2ytRmd9wPxH0RNjZ6KNdQ/view)]\n\n#### Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization\nTao Yang*, Rongyuan Wu, Peiran Ren, Xuansong Xie, Lei Zhang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2308.14469)] [[Code](https://github.com/yangxy/PASD/)] [[Data](https://huggingface.co/datasets/yangtao9009/PASD_dataset)] [[Demo](https://colab.research.google.com/drive/1lZ_-rSGcmreLCiRniVT973x6JLjFiC-b?usp=sharing)]\n\n#### XPSR: Cross-modal Priors for Diffusion-based Image Super-Resolution\nQu Yunpeng*, Kun Yuan, Kai Zhao, Qizhi Xie, Jinhua Hao, Ming Sun, Chao Zhou\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2403.05049)] [[Code](https://github.com/qyp2000/XPSR)]\n\n#### DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation\nYiqun Duan*, Xianda Guo*, Zheng Zhu\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2303.05021)] [[Code](https://github.com/duanyiqun/DiffusionDepth)]\n\n#### DC-Solver: Improving Predictor-Corrector Diffusion Sampler via Dynamic Compensation\nWenliang Zhao, Haolin Wang, Jie Zhou, Jiwen Lu*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2409.03755)] [[Code](https://github.com/wl-zhao/DC-Solver)]\n\n#### Enhancing Perceptual Quality in Video Super-Resolution through Temporally-Consistent Detail Synthesis using Diffusion Models\nClaudio Rota*, Marco Buzzelli, Joost van de Weijer\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2311.15908)] [[Code](https://github.com/claudiom4sir/StableVSR)]\n\n#### DreamDissector: Learning Disentangled Text-to-3D Generation from 2D Diffusion Priors\nZizheng Yan*, Jiapeng Zhou, Fanpeng Meng, Yushuang Wu, Lingteng Qiu, Zisheng Ye, Shuguang Cui, Guanying CHEN, Xiaoguang Han*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.16260)] [[Project](https://chester256.github.io/dreamdissector/)] [[Video](https://youtu.be/qHiEoio7SJ0)]\n\n#### Videoshop: Localized Semantic Video Editing with Noise-Extrapolated Diffusion Inversion\nXiang Fan*, Anand Bhattad, Ranjay Krishna\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2403.14617)] [[Project](https://videoshop-editing.github.io/)] [[Code](https://github.com/sfanxiang/videoshop)] [[Supplementary](https://videoshop-editing.github.io/static/supplementary/)] [[Video](https://videoshop-editing.github.io/static/supplementary/assets/intro.mp4)]\n\n#### Diffusion-Based Image-to-Image Translation by Noise Correction via Prompt Interpolation\nJunsung Lee, Minsoo Kang, Bohyung Han*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2409.08077)] [[Code](https://github.com/JS-Lee525/PIC)]\n\n#### RadEdit: stress-testing biomedical vision models via diffusion image editing\nFernando Pérez-García, Sam Bond-Taylor, Pedro Sanchez, Boris van Breugel, Daniel Coelho de Castro, Harshita Sharma, Valentina Salvatelli, Maria Teodora A Wetscherek, Hannah CM Richardson, Lungren Matthew, Aditya Nori, Javier Alvarez-Valle, Ozan Oktay, Maximilian Ilse*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2312.12865)] [[Project](https://huggingface.co/microsoft/radedit)]\n\n#### AdaDiffSR: Adaptive Region-aware Dynamic acceleration Diffusion Model for Real-World Image Super-Resolution\nYuanting Fan, Chengxu Liu, Nengzhong Yin, Changlong Gao, Xueming Qian*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[paper](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/01944.pdf)] [[Video](https://www.youtube.com/watch?v=UcmJI3Cd9UM)]\n\n#### Exploring Pre-trained Text-to-Video Diffusion Models for Referring Video Object Segmentation\nXuelu Feng, Dongdong Chen, Junsong Yuan, Chunming Qiao, Gang Hua, Zixin Zhu*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2403.12042)] [[Code](https://github.com/buxiangzhiren/VD-IT)] [[Video](https://youtu.be/da-Fs5-ZyLc)]\n\n#### Co-synthesis of Histopathology Nuclei Image-Label Pairs using a Context-Conditioned Joint Diffusion Model\nSeonghui Min, Hyun-Jic Oh, Won-Ki Jeong*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.14434)]\n\n#### MVDD: Multi-View Depth Diffusion Models\nZhen Wang*, Qiangeng Xu, Feitong Tan, Menglei Chai, Shichen Liu, Rohit Pandey, Sean Fanello, Achuta Kadambi, Yinda Zhang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2312.04875)] [[Project](https://mvdepth.github.io/)]\n\n#### EBDM: Exemplar-guided Image Translation with Brownian-bridge Diffusion Models\nEungbean Lee, Somi Jeong, Kwanghoon Sohn*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2205.07680)]\n\n#### DreamDrone: Text-to-Image Diffusion Models are Zero-shot Perpetual View Generators\nHanyang Kong*, Dongze Lian, Michael Bi Mi, Xinchao Wang*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/html/2312.08746v3)] [[Project](https://hyokong.github.io/dreamdrone-page/)] [[Code](https://github.com/HyoKong/DreamDrone)] [[Demo](https://huggingface.co/spaces/imsuperkong/dreamdrone)]\n\n#### Harnessing Text-to-Image Diffusion Models for Category-Agnostic Pose Estimation\nDuo Peng, Zhengbo Zhang, Ping Hu, Qiuhong Ke, David Yau, Jun Liu*\n\u003cbr\u003e ![Oral Badge](https://img.shields.io/badge/Oral-blue) [[paper](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/02103.pdf)]\n\n#### M2D2M: Multi-Motion Generation from Text with Discrete Diffusion Models\nSeunggeun Chi*, Hyung-gun Chi, Hengbo Ma, Nakul Agarwal, Faizan Siddiqui, Karthik Ramani*, Kwonjoon Lee*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2407.14502)] [[Video](https://www.youtube.com/watch?v=DERy31VEK2g)]\n\n#### Shapefusion: 3D localized human diffusion models\nRolandos Alexandros Potamias*, Michael Tarasiou, Stylianos Ploumpis, Stefanos Zafeiriou\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.19773) [[Project](https://rolpotamias.github.io/Shapefusion/)]\n\n#### Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing\nWonjun Kang, Kevin Galim, Hyung Il Koo*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.09468) [[Code](https://github.com/furiosa-ai/eta-inversion)] [[Video](https://www.youtube.com/watch?v=NwqK9p4GKlo)]\n\n#### MixDQ: Memory-Efficient Few-Step Text-to-Image Diffusion Models with Metric-Decoupled Mixed Precision Quantization\nTianchen Zhao*, Xuefei Ning, Tongcheng Fang, Enshu Liu, Guyue Huang, Zinan Lin, Shengen Yan, Guohao Dai, Yu Wang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2405.17873) [[Project](https://a-suozhang.xyz/mixdq.github.io/)] [[Code](https://github.com/A-suozhang/MixDQ)] [[Huggingface](https://huggingface.co/nics-efc/MixDQ)]\n\n#### RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models\nBowen Zhang, Yiji Cheng, Chunyu Wang*, Ting Zhang, Jiaolong Yang, Yansong Tang, Feng Zhao, Dong Chen, Baining Guo\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://www.arxiv.org/abs/2407.06938) [[Project](https://rodinhd.github.io/)] [[Code](https://github.com/RodinHD/RodinHD)]\n\n#### A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting\nWouter Van Gansbeke*, Bert De Brabandere\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2401.10227) [[Code](https://github.com/segments-ai/latent-diffusion-segmentation)]\n\n#### Lego: Learning to Disentangle and Invert Personalized Concepts Beyond Object Appearance in Text-to-Image Diffusion Models\nSaman Motamed*, Danda Pani Paudel, Luc Van Gool\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2311.13833) [[Project](https://sam-motamed.github.io/projects/lego)]\n\n#### IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation\nYuanhao Zhai*, Kevin Lin, Linjie Li, Chung-Ching Lin, Jianfeng Wang, Zhengyuan Yang, David Doermann, Junsong Yuan, Zicheng Liu, Lijuan Wang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.10937) [[Code](https://github.com/yhZhai/idol)]\n\n#### DCDM: Diffusion-Conditioned-Diffusion Model for Scene Text Image Super-Resolution\nShrey Singh*, Prateek Keserwani, Masakazu Iwamura*, Partha Pratim Roy\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [paper]([DCDM: Diffusion-Conditioned-Diffusion Model for Scene Text Image Super-Resolution](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/02357.pdf)) [[Code](https://github.com/shreygithub/DCDM)]\n\n#### DreamMover: Leveraging the Prior of Diffusion Models for Image Interpolation with Large Motion\nLiao Shen, Tianqi Liu, Huiqiang Sun, Xinyi Ye, Baopu Li, Jianming Zhang, Zhiguo Cao*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://www.arxiv.org/abs/2409.09605) [Code](https://github.com/leoShen917/DreamMover)\n\n#### Efficient Diffusion Transformer with Step-wise Dynamic Attention Mediators\nYifan Pu*, Zhuofan Xia, Jiayi Guo, Dongchen Han, Qixiu Li, Duo Li, Yuhui Yuan, Ji Li, Yizeng Han, Shiji Song, Gao Huang*, Xiu Li*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2408.05710) [Code](https://github.com/LeapLabTHU/Attention-Mediators)\n\n#### Diffusion Model is a Good Pose Estimator from 3D RF-Vision\nJunqiao Fan, Jianfei Yang*, Yuecong Xu, Lihua Xie\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2403.16198)]\n\n#### MVDiffHD: A Dense High-resolution Multi-view Diffusion Model for Single or Sparse-view 3D Object Reconstruction\nShitao Tang*, Jiacheng Chen, Dilin Wang, Chengzhou Tang, Fuyang Zhang, Yuchen Fan, Vikas Chandra, Yasutaka Furukawa, Rakesh Ranjan\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2402.12712)] [[Project](https://mvdiffusion-plusplus.github.io/)] [[Code](https://github.com/Tangshitao/MVDiffusion_plusplus)]\n\n#### Diffusion-Generated Pseudo-Observations for High-Quality Sparse-View Reconstruction\nXinhang Liu*, Jiaben Chen, Shiu-Hong Kao, Yu-Wing Tai, Chi-Keung Tang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2305.15171)] [[Project](https://xinhangliu.com/deceptive-nerf-3dgs)]\n\n#### Memory-Efficient Fine-Tuning for Quantized Diffusion Model\nHyogon Ryu, Seohyun Lim, Hyunjung Shim*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2401.04339) [[Code](https://github.com/ugonfor/TuneQDM)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/1781.png?t=1727550795.317845)]\n\n#### COIN: Control-Inpainting Diffusion Prior for Human and Camera Motion Estimation\nJiefeng Li*, Ye Yuan, Davis Rempe, Haotian Zhang, Pavlo Molchanov, Cewu Lu, Jan Kautz, Umar Iqbal*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2408.16426)\n\n#### FreeCompose: Generic Zero-Shot Image Composition with Diffusion Prior\nZhekai Chen, Wen Wang, Zhen Yang, Zeqing Yuan, Hao Chen*, Chunhua Shen*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.04947) [[Code](https://github.com/aim-uofa/FreeCompose)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/297.png?t=1725802844.8353653)] [[Slides](https://eccv.ecva.net/media/eccv-2024/Slides/297.pdf)]\n\n#### WildVidFit: Video Virtual Try-On in the Wild via Image-Based Controlled Diffusion Models\nZijian He, Peixin Chen, Guangrun Wang, Guanbin Li*, Philip Torr, Liang Lin\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.10625) [[Project](https://wildvidfit-project.github.io/)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/2494.png?t=1726192744.396735)]\n\n#### RegionDrag: Fast Region-Based Image Editing with Diffusion Models\nJingyi Lu, Xinghui Li, Kai Han*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.18247) [[Project](https://visual-ai.github.io/regiondrag/)] [[Demo](https://colab.research.google.com/drive/1pnq9t_1zZ8yL_Oba20eBLVZLp3glniBR?usp=sharing)] [[Code](https://github.com/Visual-AI/RegionDrag)] [[Slides](https://eccv.ecva.net/media/eccv-2024/Slides/1756_57T8SZT.pdf)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/1756.png?t=1726153953.1186402)] [[Dataset](https://visual-ai.github.io/regiondrag/#dataset)]\n\n#### MagDiff: Multi-Alignment Diffusion for High-Fidelity Video Generation and Editing\nHaoyu Zhao, Tianyi Lu, Jiaxi Gu, Xing Zhang, Qingping Zheng, Zuxuan Wu*, Hang Xu, Yu-Gang Jiang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://arxiv.org/abs/2311.17338)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/665.png?t=1726062032.621387)]\n\n#### Mutual Learning for Acoustic Matching and Dereverberation via Visual Scene-driven Diffusion\nJian Ma, Wenguan Wang*, Yi Yang, Feng Zheng\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [[arXiv](https://www.arxiv.org/abs/2407.10373)] [[Project](https://hechang25.github.io/MVSD/)] [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/1096.png?t=1726061514.9066596)] [[Code](https://github.com/hechang25/MVSD)]\n\n#### SEDiff: Structure Extraction for Domain Adaptive Depth Estimation via Denoising Diffusion Models\nDongseok Shim*, Hyoun Jin Kim*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/02829.pdf) [[Poster](https://eccv.ecva.net/media/PosterPDFs/ECCV%202024/973.png?t=1726087766.2618341)]\n\n#### MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model\nMuyao Niu, Xiaodong Cun*, Xintao Wang, Yong Zhang, Ying Shan, Yinqiang Zheng*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2405.20222) [[Project]()] [[Code]()]\n\n#### RoofDiffusion: Constructing Roofs from Severely Corrupted Point Data via Diffusion\nKyle Shih-Huang Lo*, Jorg Peters, Eric Spellman\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2404.09290) [[Project]()] [[Code]()]\n\n#### L-DiffER: Single Image Reflection Removal with Language-based Diffusion Model\nYuchen Hong*, Haofeng Zhong*, Shuchen Weng, Jinxiu S Liang, Boxin Shi\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://assets.ctfassets.net/yreyglvi5sud/4uhN2PF7UyMGgiWQgCMSgi/41f4f9f46fbfa370b3ccd8fbcadbc2b3/2024______Hong_ECCV.pdf) [[Project]()] [[Code]()]\n\n#### BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion\nXuan Ju*, Xian Liu, Xintao Wang*, Yuxuan Bian, Ying Shan, Qiang Xu*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.06976) [[Project]()] [[Code]()]\n\n#### Realistic Human Motion Generation with Cross-Diffusion Models\nZeping Ren, Shaoli Huang*, Xiu Li*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2312.10993) [[Project]()] [Code]()\n\n#### ZigMa: A DiT-style Zigzag Mamba Diffusion Model\nVincent Tao Hu*, Stefan A Baumann, Ming Gui, Olga Grebenkova, Pingchuan Ma, Johannes S Fischer, Bjorn Ommer\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.13802) [[Project]()] [Code]()\n\n#### EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion\nGuangyao Zhai*, Evin Pınar Örnek, Dave Zhenyu Chen, Ruotong Liao, Yan Di, Nassir Navab, Federico Tombari, Benjamin Busam\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2405.00915) [[Project]()] [Code]()\n\n#### Safe-Sim: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries\nWei-Jer Chang*, Francesco Pittaluga, Masayoshi Tomizuka, Wei Zhan, Manmohan Chandraker\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2401.00391) [[Project]()] [Code]()\n\n#### Implicit Concept Removal of Diffusion Models\nZhili Liu*, Kai Chen, Yifan Zhang, Jianhua Han, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung, James Kwok\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2310.05873) [[Project]()] [Code]()\n\n#### GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image\nXiao Fu*, Wei Yin, Mu Hu, Kaixuan Wang, Yuexin Ma, Ping Tan, Shaojie Shen, Dahua Lin, Xiaoxiao Long\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.12013) [[Project]()] [Code]()\n\n#### Diffusion Models for Monocular Depth Estimation: Overcoming Challenging Conditions\nFabio Tosi, Pierluigi Zama Ramirez, Matteo Poggi*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.16698) [[Project]()] [Code]()\n\n#### Lazy Diffusion Transformer for Interactive Image Editing\nYotam Nitzan*, Zongze Wu, Richard Zhang, Eli Shechtman, Danny Cohen-Or, Taesung Park, Michaël Gharbi\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2404.12382) [[Project]()] [Code]()\n\n#### ComboVerse: Compositional 3D Assets Creation Using Spatially-Aware Diffusion Guidance\nYongwei Chen, Tengfei Wang, Tong Wu, Xingang Pan, Kui Jia*, Ziwei Liu\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.12409) [[Project]()] [Code]()\n\n#### 4Diff: 3D-Aware Diffusion Model for Third-to-First Viewpoint Translation\nFeng Cheng*, Mi Luo*, Huiyu Wang, Alex Dimakis, Lorenzo Torresani, Gedas Bertasius, Kristen Grauman\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://eccv.ecva.net/virtual/2024/poster/1665) [[Project]()] [Code]()\n\n#### Enhancing Diffusion Models with Text-Encoder Reinforcement Learning\nChaofeng Chen*, Annan Wang, Haoning Wu, Liang Liao, Wenxiu Sun, Qiong Yan, Weisi Lin*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2311.15657) [[Project]()] [Code]()\n\n#### Local Action-Guided Motion Diffusion Model for Text-to-Motion Generation\nPeng Jin*, Hao Li, Zesen Cheng, Kehan Li, Runyi Yu, Chang Liu*, Xiangyang Ji, Li Yuan*, Jie Chen\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.10528) [[Project]()] [Code]()\n\n#### MacDiff: Unified Skeleton Modeling with Masked Conditional Diffusion\nLehong Wu*, Lilang Lin, Jiahang Zhang, Yiyang Ma, Jiaying Liu*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://www.arxiv.org/abs/2409.10473) [[Project]()] [Code]()\n\n#### Source Prompt Disentangled Inversion for Boosting Image Editability with Diffusion Models\nRuibin Li*, Ruihuang Li, Song Guo, Lei Zhang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.11105) [[Project]()] [Code]()\n\n#### StyleTokenizer: Defining Image Style by a Single Instance for Controlling Diffusion Models\nWen Li*, Muyuan Fang, Cheng Zou, Biao Gong, Ruobing Zheng, Meng Wang, Jingdong Chen, Ming Yang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2409.02543) [[Project]()] [Code]()\n\n#### NL2Contact: Natural Language Guided 3D Hand-Object Contact Modeling with Diffusion Model\nZhongqun Zhang*, Hengfei Wang, Ziwei Yu, Yihua Cheng*, Angela Yao, Hyung Jin Chang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.12727) [[Project]()] [Code]()\n\n#### Diff-Tracker: Text-to-Image Diffusion Models are Unsupervised Trackers\nZhengbo Zhang*, Li Xu, Duo Peng, Hossein Rahmani, Jun Liu*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.08394) [[Project]()] [Code]()\n\n#### Transferable 3D Adversarial Shape Completion using Diffusion Models\nXuelong Dai*, Bin Xiao\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](http://arxiv.org/abs/2407.10077) [[Project]()] [Code]()\n\n#### Distilling Diffusion Models into Conditional GANs\nMinGuk Kang*, Richard Zhang, Connelly Barnes, Sylvain Paris, Suha Kwak, Jaesik Park, Eli Shechtman, Jun-Yan Zhu, Taesung Park*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2405.05967) [[Project]()] [Code]()\n\n#### You Only Need One Step: Fast Super-Resolution with Stable Diffusion via Scale Distillation\nMehdi Noroozi*, Isma Hadji*, Brais Martinez*, Adrian Bulat*, Georgios Tzimiropoulos*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2401.17258) [[Project]()] [Code]()\n\n#### Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation\nYixiao Wang*, Chen Tang, Lingfeng Sun, Simone Rossi, Yichen Xie, Chensheng Peng, Thomas Hannagan, Stefano Sabatini, Nicola Poerio, Masayoshi TOMIZUKA, Wei Zhan\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2408.00766) [[Project]()] [Code]()\n\n#### Open-Vocabulary 3D Semantic Segmentation with Text-to-Image Diffusion Models\nXiaoyu Zhu*, Hao Zhou, Pengfei Xing, Long Zhao, Hao Xu, Junwei Liang, Alexander G. Hauptmann, Ting Liu, Andrew Gallagher\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.13642) [[Project]()] [Code]()\n\n#### D-SCo: Dual-Stream Conditional Diffusion for Monocular Hand-Held Object Reconstruction\nBowen Fu*, Gu Wang*, Chenyangguang Zhang, Yan Di, Ziqin Huang, Zhiying Leng, Fabian Manhardt, Xiangyang Ji*, Federico Tombari*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2311.14189) [[Project]()] [Code]()\n\n#### Probabilistic Weather Forecasting with Deterministic Guidance-based Diffusion Model\nDonggeun Yoon, Minseok Seo, Doyi Kim, Yeji Choi, Donghyeon Cho*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/04326.pdf) [[Project]()] [Code]()\n\n#### Diffusion-Driven Data Replay: A Novel Approach to Combat Forgetting in Federated Class Continual Learning\nJinglin Liang, Jin Zhong, Hanlin Gu, Zhongqi Lu, Xingxing Tang, Gang Dai, Shuangping Huang*, Lixin Fan, Qiang Yang\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2409.01128) [Code]()\n\n#### View Selection for 3D Captioning via Diffusion Ranking\nTiange Luo*, Justin Johnson, Honglak Lee\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2404.07984) [Code]()\n\n#### OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model\nRunyi Li*, Xuhan Sheng, Weiqi Li, Jian Zhang*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2404.10312) [Code]()\n\n#### UDiffText: A Unified Framework for High-quality Text Synthesis in Arbitrary Images via Character-aware Diffusion Models\nYiming Zhao*, Zhouhui Lian*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2312.04884) [Code]()\n\n#### OMG: Occlusion-friendly Personalized Multi-concept Generation in Diffusion Models\nZhe Kong*, Yong Zhang*, Tianyu Yang, Tao Wang, Kaihao Zhang, Bizhu Wu, Guanying Chen, Wei Liu, Wenhan Luo*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2403.10983) [Code]()\n\n#### CloudFixer: Test-Time Adaptation for 3D Point Clouds via Diffusion-Guided Geometric Transformation\nHajin Shim, Changhun Kim, Eunho Yang*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2407.16193) [Code]()\n\n#### DreamDiffusion: High-Quality EEG-to-Image Generation with Temporal Masked Signal Modeling and CLIP Alignment\nYunpeng Bai*, Xintao Wang, Yan-Pei Cao, Yixiao Ge, Chun Yuan, Ying Shan\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2306.16934) [Code]()\n\n#### SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image Synthesis\nHuan-ang Gao, Mingju Gao, Jiaju Li, Wenyi Li, Rong Zhi, Hao Tang, Hao Zhao*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.09638) [Code]()\n\n#### PixArt-Sigma: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation\nJunsong Chen, Chongjian GE, Enze Xie*, Yue Wu, Lewei Yao, Xiaozhe Ren, Zhongdao Wang, Ping Luo, Huchuan Lu, Zhenguo Li\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.04692) [Code]()\n\n#### Customize-A-Video: One-Shot Motion Customization of Text-to-Video Diffusion Models\nYixuan Ren*, Yang Zhou, Jimei Yang, Jing Shi, Difan Liu, Feng Liu, Mingi Kwon, Abhinav Shrivastava\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2402.14780) [Code]()\n\n#### ∞-Brush: Controllable Large Image Synthesis with Diffusion Models in Infinite Dimensions\nMinh-Quan Le*, Alexandros Graikos, Srikar Yellapragada, Rajarsi Gupta, Joel Saltz, Dimitris Samaras\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.14709) [Code]()\n\n#### ProTIP: Probabilistic Robustness Verification on Text-to-Image Diffusion Models against Stochastic Perturbation\nYi Zhang, Yun Tang, Wenjie Ruan, Xiaowei Huang, Siddartha Khastgir, Paul A Jennings, Xingyu Zhao*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2402.15429) [Code]()\n\n#### Latent Diffusion Prior Enhanced Deep Unfolding for Snapshot Spectral Compressive Imaging\nZongliang Wu*, Ruiying Lu, Ying Fu, Xin Yuan\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.14280) [Code]()\n\n#### Learning Diffusion Models for Multi-View Anomaly Detection\nChieh Liu*, Yu-Min Chu*, Ting-I Hsieh*, Hwann-Tzong Chen*, Tyng-Luh Liu*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/04907.pdf) [Code]()\n\n#### Diff3DETR: Agent-based Diffusion Model for Semi-supervised 3D Object Detection\nJiacheng Deng*, Jiahao Lu, Tianzhu Zhang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.00286) [Code]()\n\n#### Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model\nShoma Iwai*, Atsuki Osanai, Shunsuke Kitada, Shinichiro Omachi\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.16689) [Code]()\n\n#### Kinetic Typography Diffusion Model\nSeonmi Park, Inhwan Bae, Seunghyun Shin, Hae-Gon Jeon*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.10476) [Code]()\n\n#### GroupDiff: Diffusion-based Group Portrait Editing\nYuming Jiang, Nanxuan Zhao*, Qing Liu, Krishna Kumar Singh, Shuai Yang, Chen Change Loy, Ziwei Liu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.14379) [Code]()\n\n#### TransFusion -- A Transparency-Based Diffusion Model for Anomaly Detection\nMatic Fučka*, Vitjan Zavrtanik, Danijel Skočaj\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.09999) [Code]()\n\n#### Test-Time Stain Adaptation with Diffusion Models for Histopathology Image Classification\nCheng-Chang Tsai*, Yuan-Chih Chen, Chun-Shien Lu*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/05175.pdf) [Code]()\n\n#### Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation\nLanqing Guo, Yingqing HE, Haoxin Chen, Menghan Xia, Xiaodong Cun, Yufei Wang, Siyu Huang, Yong Zhang, Xintao Wang, Qifeng Chen, Ying Shan, Bihan Wen*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2402.10491) [Code]()\n\n#### R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection\nZheyuan Zhou, Le Wang, Naiyu Fang, Zili Wang, Lemiao Qiu*, Shuyou Zhang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.10862) [Code]()\n\n#### Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models\nQinyu Yang, Haoxin Chen, Yong Zhang*, Menghan Xia, Xiaodong Cun, Zhixun Su*, Ying Shan\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2407.10285) [Code]()\n\n#### Revisiting Feature Disentanglement Strategy in Diffusion Training and Breaking Conditional Independence Assumption in Sampling\nWonwoong Cho*, Hareesh Ravi*, Midhun Harikumar, Vinh Khuc, Krishna Kumar Singh, Jingwan Lu, David Iseri Inouye*, Ajinkya Kale*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/05452.pdf) [Code]()\n\n#### MaxFusion: Plug\u0026Play Multi-Modal Generation in Text-to-Image Diffusion Models\nNithin Gopalakrishnan Nair*, Jeya Maria Jose Valanarasu, Vishal Patel\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.09977) [Code]()\n\n#### DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control\nYuru Jia, Lukas Hoyer, Shengyu Huang, Tianfu Wang, Luc Van Gool, Konrad Schindler, Anton Obukhov*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.03048) [Code]()\n\n#### Surf-D: Generating High-Quality Surfaces of Arbitrary Topologies Using Diffusion Models\nZhengming Yu*, Zhiyang Dou, Xiaoxiao Long, Cheng Lin, Zekun Li, Yuan Liu, Norman Müller, Taku Komura, Marc Habermann, Christian Theobalt, Xin Li, Wenping Wang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17050) [Code]()\n\n#### Diffusion-Refined VQA Annotations for Semi-Supervised Gaze Following\nQiaomu Miao*, Alexandros Graikos, Jingwei Zhang, Sounak Mondal, Minh Hoai, Dimitris Samaras\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2406.02774) [Code]()\n\n#### Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models\nRohit Gandikota*, Joanna Materzynska, Tingrui Zhou, Antonio Torralba, David Bau\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.12092) [Code]()\n\n#### AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion\nYitong Jiang*, Zhaoyang Zhang, Tianfan Xue, Jinwei Gu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.10123) [Code]()\n\n#### Receler: Reliable Concept Erasing of Text-to-Image Diffusion Models via Lightweight Erasers\nChi-Pin Huang*, Kai-Po Chang, Chung-Ting Tsai, Yung-Hsuan Lai, Fu-En Yang, Yu-Chiang Frank Wang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17717) [Code]()\n\n#### Temporal Residual Guided Diffusion Framework for Event-Driven Video Reconstruction\nLin Zhu*, Yunlong Zheng, Yijun Zhang, Xiao Wang, Lizhi Wang, Hua Huang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.10636) [Code]()\n\n#### Free-ATM: Harnessing Free Attention Masks for Representation Learning on Diffusion-Generated Images\nDavid Junhao Zhang*, Mutian Xu, Jay Zhangjie Wu, Chuhui Xue, Wenqing Zhang, Xiaoguang Han, Song Bai, Mike Zheng Shou*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2308.06739) [Code]()\n\n#### AlignDiff: Aligning Diffusion Models for General Few-Shot Segmentation\nRi-Zhao Qiu*, Yu-Xiong Wang, Kris Hauser\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/05794.pdf) [Code]()\n\n#### Tree-D Fusion: Simulation-Ready Tree Dataset from Single Images with Diffusion Priors\nJae Joong Lee, Bosheng Li, Sara M Beery, Jonathan Huang, Songlin Fei, Raymond A. Yeh, Bedrich Benes*\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2407.10330) [Code]()\n\n#### DomainFusion: Generalizing To Unseen Domains with Latent Diffusion Models\nYuyang Huang, Yabo Chen, Yuchen Liu, xiaopeng zhang*, Wenrui Dai*, Hongkai Xiong, Qi Tian\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/05806.pdf) [Code]()\n\n#### Object-Conditioned Energy-Based Attention Map Alignment in Text-to-Image Diffusion Models\nYasi Zhang*, Peiyu Yu, Ying Nian Wu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.07389) [Code]()\n\n#### Three Things We Need to Know About Transferring Stable Diffusion to Visual Dense Prediciton Tasks\nManyuan Zhang*, Guanglu Song, Xiaoyu Shi, Yu Liu, Hongsheng Li\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/05837.pdf) [Code]()\n\n#### SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models\nYuwei Guo, Ceyuan Yang*, Anyi Rao, Maneesh Agrawala, Dahua Lin*, Bo Dai*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.16933) [Code]()\n\n#### Diffusion Reward: Learning Rewards via Conditional Video Diffusion\nTao Huang*, Guangqi Jiang, Yanjie Ze, Huazhe Xu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.14134) [Code]()\n\n#### SpeedUpNet: A Plug-and-Play Adapter Network for Accelerating Text-to-Image Diffusion Models\nWeilong Chai*, Dandan Zheng, Jiajiong Cao, Zhiquan Chen, Changbao Wang, Chenguang Ma\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.08887) [Code]()\n\n#### DECap: Towards Generalized Explicit Caption Editing via Diffusion Mechanism\nZhen Wang, Xinyun Jiang, Jun Xiao, Tao Chen, Long Chen*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.14920) [Code]()\n\n#### DiffuX2CT: Diffusion Learning to Reconstruct CT Images from Biplanar X-Rays\nXuhui Liu, Zhi Qiao, Runkun Liu, Hong Li, Xiantong Zhen*, Zhen Qian, Juan Zhang*, Baochang Zhang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.13545) [Code]()\n\n#### MoVideo: Motion-Aware Video Generation with Diffusion Models\nJingyun Liang*, Yuchen Fan, Kai Zhang*, Radu Timofte, Luc Van Gool, Rakesh Ranjan\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.11325) [Code]()\n\n#### Learn to Optimize Denoising Scores: A Unified and Improved Diffusion Prior for 3D Generation\nXiaofeng Yang*, Yiwen Chen, Cheng Chen, Chi Zhang, Yi Xu, Xulei Yang, Fayao Liu, Guosheng Lin\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.04820) [Code]()\n\n#### Motion-Guided Latent Diffusion for Temporally Consistent Real-world Video Super-resolution\nXi Yang*, Chenhang He, Jianqi Ma, Lei Zhang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.00853) [Code]()\n\n#### DeCo: Decoupled Human-Centered Diffusion Video Editing with Motion Consistency\nXiaojing Zhong, Xinyi Huang, Xiaofeng Yang, Guosheng Lin*, Qingyao Wu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.07481) [Code]()\n\n#### Unleashing the Potential of the Semantic Latent Space in Diffusion Models for Image Dehazing\nZizheng Yang, Hu Yu, Bing Li, Jinghao Zhang, Jie Huang, Feng Zhao*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/06072.pdf) [Code]()\n\n#### PanGu-Draw: Advancing Resource-Efficient Text-to-Image Synthesis with Time-Decoupled Training and Reusable Coop-Diffusion\nGuansong Lu*, Yuanfan Guo, Jianhua Han, Minzhe Niu, Yihan Zeng, Songcen Xu, Zeyi Huang, Zhao Zhong, Wei Zhang, Hang Xu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.16486) [Code]()\n\n#### Closed-Loop Unsupervised Representation Disentanglement with $\\\\beta$-VAE Distillation and Diffusion Probabilistic Feedback\nXin Jin*, Bohan Li*, Baao Xie, Wenyao Zhang, Jinming Liu, Ziqiang Li, Tao Yang, Wenjun Zeng\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2402.02346) [Code]()\n\n#### Rethinking Video Deblurring with Wavelet-Aware Dynamic Transformer and Diffusion Model\nChen Rao, Guangyuan Li, Zehua Lan, Jiakai Sun, Junsheng Luan, Wei Xing*, Lei Zhao*, Huaizhong Lin*, Jianfeng Dong, Dalong Zhang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.13459) [Code]()\n\n#### D4-VTON: Dynamic Semantics Disentangling for Differential Diffusion based Virtual Try-On\nZhaotong Yang, Zicheng Jiang, Xinzhe Li, Huiyu Zhou, Junyu Dong, Huaidong Zhang, Yong Du*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.15111) [Code]()\n\n#### AdvDiff: Generating Unrestricted Adversarial Examples using Diffusion Models\nXuelong Dai*, Kaisheng Liang, Bin Xiao\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2307.12499) [Code]()\n\n#### DiffPMAE: Diffusion Masked Autoencoders for Point Cloud Reconstruction\nYanlong LI*, Chamara Madarasingha, Kanchana Thilakarathna\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.03298) [Code]()\n\n#### DynamiCrafter: Animating Open-domain Images with Video Diffusion Priors\nJinbo Xing*, Menghan Xia, Yong Zhang, Haoxin Chen, Wangbo Yu, Hanyuan Liu, Gongye Liu, Xintao Wang, Ying Shan, Tien-Tsin Wong\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.12190) [Code]()\n\n#### Text-Anchored Score Composition: Tackling Condition Misalignment in Text-to-Image Diffusion Models\nLuozhou Wang*, Guibao Shen, Wenhang Ge, Guangyong Chen, Yijun Li, Yingcong Chen*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2306.14408) [Code]()\n\n#### LightenDiffusion: Unsupervised Low-Light Image Enhancement with Latent-Retinex Diffusion Models\nHai Jiang, Ao Luo, Xiaohong Liu, Songchen Han, Shuaicheng Liu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.08939) [Code]()\n\n#### DNI: Dilutional Noise Initialization for Diffusion Video Editing\nSunjae Yoon, Gwanhyeong Koo, Ji Woo Hong, Chang D. Yoo*\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2409.13037) [Code]()\n\n#### Diffusion-Guided Weakly Supervised Semantic Segmentation\nSung-Hoon Yoon, Hoyong Kwon, Jaeseok Jeong, Daehee Park, Kuk-Jin Yoon*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/06482.pdf) [Code]()\n\n#### Improving Virtual Try-On with Garment-focused Diffusion Models\nSiqi Wan, Yehao Li, Jingwen Chen, Yingwei Pan*, Ting Yao, Yang Cao, Tao Mei\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.08258) [Code]()\n\n#### Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control\nYue Han*, Junwei Zhu, Keke He, Xu Chen, Yanhao Ge, Wei Li, Xiangtai Li, Jiangning Zhang, Chengjie Wang, Yong Liu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2405.12970) [Code]()\n\n#### Diffusion Models as Optimizers for Efficient Planning in Offline RL\nRenming Huang, Yunqiang Pei, Guoqing Wang*, Yangming Zhang, Yang Yang, Peng Wang, Heng Tao Shen\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.16142) [Code]()\n\n#### HiDiffusion: Unlocking Higher-Resolution Creativity and Efficiency in Pretrained Diffusion Models\nShen Zhang, Zhaowei CHEN, Zhenyu Zhao, Yuhao Chen, Yao Tang, Jiajun Liang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17528) [Code]()\n\n#### Dolfin: Diffusion Layout Transformers without Autoencoder\nYilin Wang, Zeyuan Chen, Liangjun Zhong, Zheng Ding, Zhuowen Tu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.16305) [Code]()\n\n#### StructLDM: Structured Latent Diffusion for 3D Human Generation\nTao Hu, Fangzhou Hong, Ziwei Liu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.01241) [Code]()\n\n#### Beyond the Contact: Discovering Comprehensive Affordance for 3D Objects from Pre-trained 2D Diffusion Models\nHyeonwoo Kim, Sookwan Han, Patrick Kwon, Hanbyul Joo*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2401.12978) [Code]()\n\n#### DIFFender: Diffusion-Based Adversarial Defense against Patch Attacks\nCaixin Kang*, Yinpeng Dong, Zhengyi Wang, Shouwei Ruan, Yubo Chen, Hang Su*, Xingxing Wei*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2306.09124) [Code]()\n\n#### Hybrid Video Diffusion Models with 2D Triplane and 3D Wavelet Representation\nKihong Kim, Haneol Lee, Jihye Park, Seyeon Kim, Kwang Hee Lee, Seungryong Kim*, Jaejun Yoo*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2402.13729) [Code]()\n\n#### Efficient Diffusion-Driven Corruption Editor for Test-Time Adaptation\nYeongtak Oh, Jonghyun Lee, Jooyoung Choi, Dahuin Jung, Uiwon Hwang*, Sungroh Yoon*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.10911) [Code]()\n\n#### Adaptive Multi-modal Fusion of Spatially Variant Kernel Refinement with Diffusion Model for Blind Image Super-Resolution\nJunxiong Lin*, Yan Wang, Zeng Tao, Boyang Wang, Qing Zhao, Haoran Wang, Xuan Tong, Xinji Mai, Yuxuan Lin, Wei Song, Jiawen Yu, Shaoqi Yan, Wenqiang Zhang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.05808) [Code]()\n\n#### Reliable and Efficient Concept Erasure of Text-to-Image Diffusion Models\nChao Gong*, Kai Chen, Zhipeng Wei, Jingjing Chen*, Yu-Gang Jiang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.12383) [Code]()\n\n#### Length-Aware Motion Synthesis via Latent Diffusion\nAlessio Sampieri*, Alessio Palma, Indro Spinelli, Fabio Galasso\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.11532) [Code]()\n\n#### Exploring Phrase-Level Grounding with Text-to-Image Diffusion Model\nDanni Yang, Ruohan Dong, Jiayi Ji, Yiwei Ma, Haowei Wang, Xiaoshuai Sun*, Rongrong Ji\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.05352) [Code]()\n\n#### Improving image synthesis with diffusion-negative sampling\nAlakh Desai*, Nuno Vasconcelos\n\u003cbr\u003e\n[arXiv]() [Code]()\n\n#### SignGen: End-to-End Sign Language Video Generation with Latent Diffusion\nFan Qi*, Yu Duan, Changsheng Xu, Huaiwen Zhang*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/06988.pdf) [Code]()\n\n#### Diffusion Prior-Based Amortized Variational Inference for Noisy Inverse Problems\nSojin Lee, Dogyun Park, Inho Kong, Hyunwoo J. Kim*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.16125) [Code]()\n\n#### TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation\nNikolai Kalischek*, Torben Peters, Jan Dirk Wegner, Konrad Schindler\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2211.13220) [Code]()\n\n#### Switch Diffusion Transformer: Synergizing Denoising Tasks with Sparse Mixture-of-Experts\nByeongjun Park, Hyojun Go, Jin-Young Kim, Sangmin Woo, Seokil Ham, Changick Kim*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.09176) [Code]()\n\n#### DiffFAS: Face Anti-Spoofing via Generative Diffusion Models\nXinxu Ge, Xin Liu*, Zitong Yu*, Jingang Shi, Chun Qi, Jie Li, Heikki Kälviäinen\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.08572) [Code]()\n\n#### BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion\nBo-Kyeong Kim*, Hyoung-Kyu Song, Thibault Castells, Shinkook Choi\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2305.15798) [Code]()\n\n#### CLIFF: Continual Latent Diffusion for Open-Vocabulary Object Detection\nWuyang Li, Xinyu Liu, Jiayi Ma, Yixuan Yuan*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/07221.pdf) [Code]()\n\n#### Gated Temporal Diffusion for Stochastic Long-term Dense Anticipation\nOlga Zatsarynna*, Emad Bahrami*, Yazan Abu Farha, Gianpiero Francesca, Jürgen Gall*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.11954) [Code]()\n\n#### MotionDirector: Motion Customization of Text-to-Video Diffusion Models\nRui Zhao, Yuchao Gu, Jay Zhangjie Wu, David Junhao Zhang, Jia-Wei Liu, weijia wu, Jussi Keppo, Mike Zheng Shou*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.08465) [Code]()\n\n#### Post-training Quantization with Progressive Calibration and Activation Relaxing for Text-to-Image Diffusion Models\nSiao Tang, Xin Wang*, Hong Chen, Chaoyu Guan, Zewen Wu, Yansong Tang, Wenwu Zhu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.06322) [Code]()\n\n#### Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors\nRuicheng Wang*, Jianfeng Xiang, Jiaolong Yang, Xin Tong\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.11503) [Code]()\n\n#### Exact Diffusion Inversion via Bidirectional Integration Approximation\nGuoqiang Zhang*, j.p. lewis, W. Bastiaan Kleijn\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2307.10829) [Code]()\n\n#### Object-Centric Diffusion for Efficient Video Editing\nKumara Kahatapitiya*, Adil Karjauv, Davide Abati*, Fatih Porikli, Yuki M Asano, Amirhossein Habibian\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2401.05735) [Code]()\n\n#### Diffusion for Natural Image Matting\nYihan Hu*, Yiheng Lin, Wei Wang, Yao Zhao, Yunchao Wei*, Humphrey Shi\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.05915) [Code]()\n\n#### Unleashing Text-to-Image Diffusion Prior for Zero-Shot Image Captioning\nJianjie Luo, Jingwen Chen, Yehao Li, Yingwei Pan*, Jianlin Feng, Hongyang Chao, Ting Yao\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/07445.pdf) [Code]()\n\n#### Factorized Diffusion: Perceptual Illusions by Noise Decomposition\nDaniel Geng*, Inbum Park, Andrew Owens\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.11615) [Code]()\n\n#### To Generate or Not? Safety-Driven Unlearned Diffusion Models Are Still Easy To Generate Unsafe Images ... For Now\nYimeng Zhang*, jinghan jia, Xin Chen, Aochuan Chen, Yihua Zhang, Jiancheng Liu, Ke Ding, Sijia Liu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.11868) [Code]()\n\n#### FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation\nXinzhi Mu*, Li Chen, Bohan CHEN, Shuyang Gu, Jianmin Bao, Dong Chen, Ji Li, Yuhui Yuan\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2406.08392) [Code]()\n\n#### One-Shot Diffusion Mimicker for Handwritten Text Generation\nGang Dai, Yifan Zhang, Quhui Ke, Qiangya Guo, Shuangping Huang*\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2409.04004) [Code]()\n\n#### Kernel Diffusion: An Alternate Approach to Blind Deconvolution\nYash Sanghvi*, Yiheng Chi, Stanley Chan\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.02319) [Code]()\n\n#### ConceptExpress: Harnessing Diffusion Models for Single-image Unsupervised Concept Extraction\nShaozhe Hao*, Kai Han*, Zhengyao Lv, Shihao Zhao, Kwan-Yee K. Wong*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.07077) [Code]()\n\n#### TCAN: Animating Human Images with Temporally Consistent Pose Guidance using Diffusion Models\nJeongho Kim*, Min-Jung Kim*, Junsoo Lee, Jaegul Choo*\n\u003cbr\u003e\n[arXiv](http://arxiv.org/abs/2407.09012) [Code]()\n\n#### DiffBIR: Toward Blind Image Restoration with Generative Diffusion Prior\nXinqi Lin*, Jingwen He, Ziyan Chen, Zhaoyang Lyu, Bo Dai, Fanghua Yu, Yu Qiao, Wanli Ouyang, Chao Dong*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2308.15070) [Code]()\n\n#### Do text-free diffusion models learn discriminative visual representations?\nSoumik Mukhopadhyay*, Matthew A Gwilliam*, Yosuke Yamaguchi, Vatsal Agarwal, Namitha Padmanabhan, Archana Swaminathan, Tianyi Zhou, Jun Ohya, Abhinav Shrivastava\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17921) [Code]()\n\n#### LogoSticker: Inserting Logos into Diffusion Models for Customized Generation\nMingkang Zhu, Xi CHEN, Zhongdao Wang, Hengshuang Zhao*, Jiaya Jia*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.13752) [Code]()\n\n#### ProCreate, Don't Reproduce! Propulsive Energy Diffusion for Creative Generation\nJack Lu*, Ryan Teehan*, Mengye Ren*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.02226) [Code]()\n\n#### IntrinsicAnything: Learning Diffusion Priors for Inverse Rendering Under Unknown Illumination\nXi Chen*, Sida Peng, Dongchen Yang, Yuan Liu, Bowen Pan, Chengfei Lyu, Xiaowei Zhou*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.11593) [Code]()\n\n#### Mixture of Efficient Diffusion Experts Through Automatic Interval and Sub-Network Selection\nAlireza Ganjdanesh*, Yan Kang, Yuchen Liu, Richard Zhang, Zhe Lin, Heng Huang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.15557) [Code]()\n\n#### Compensation Sampling for Improved Convergence in Diffusion Models\nHui Lu*, Albert Ali Salah, Ronald Poppe\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.06285) [Code]()\n\n#### Lossy Image Compression with Foundation Diffusion Models\nLucas Relic*, Roberto Azevedo, Markus Gross, Christopher Schroers*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.08580) [Code]()\n\n#### FMBoost: Boosting Latent Diffusion with Flow Matching\nJohannes S Fischer*, Ming Gui, Pingchuan Ma, Nick Stracke, Stefan Andreas Baumann, Vincent Tao Hu, Björn Ommer\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.07360) [Code]()\n\n#### Diffusion Models as Data Mining Tools\nIoannis Siglidis*, Aleksander Holynski, Alexei A. Efros, Mathieu Aubry, Shiry Ginosar\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.02752) [Code]()\n\n#### Photorealistic Object Insertion with Diffusion-Guided Inverse Rendering\nRuofan Liang, Zan Gojcic, Merlin Nimier-David, David Acuna, Nandita Vijaykumar, Sanja Fidler, Zian Wang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.09702) [Code]()\n\n#### MobileDiffusion: Instant Text-to-Image Generation on Mobile Devices\nYang Zhao*, Zhisheng Xiao*, Yanwu Xu, Haolin Jia, Tingbo Hou\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.16567) [Code]()\n\n#### Osmosis: RGBD Diffusion Prior for Underwater Image Restoration\nOpher Bar Nathan*, Deborah Levy, Tali Treibitz, Dan Rosenbaum\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.14837) [Code]()\n\n#### Large-scale Reinforcement Learning for Diffusion Models\nYinan Zhang*, Eric Tzeng, Yilun Du, Dmitry Kislyuk*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2401.12244) [Code]()\n\n#### CoMusion: Towards Consistent Stochastic Human Motion Prediction via Motion Diffusion\nJiarui Sun*, Girish Chowdhary*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2305.12554) [Code]()\n\n#### EditShield: Protecting Unauthorized Image Editing by Instruction-guided Diffusion Models\nRuoxi Chen, Haibo Jin, Yixin Liu, Jinyin Chen*, Haohan Wang, Lichao Sun\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.12066) [Code]()\n\n#### Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities\nLorenzo Baraldi*, Federico Cocchi, Marcella Cornia, Lorenzo Baraldi, Alessandro Nicolosi, Rita Cucchiara\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.20337) [Code]()\n\n#### Diffusion Soup: Model Merging for Text-to-Image Diffusion Models\nBenjamin J Biggs*, Arjun Seshadri, Yang Zou, Achin Jain, Aditya Golatkar, Yusheng Xie, Alessandro Achille, Ashwin Swaminathan, Stefano Soatto\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2406.08431) [Code]()\n\n#### DEPICT: Diffusion-Enabled Permutation Importance for Image Classification Tasks\nSarah Jabbour*, Gregory Kondas, Ella Kazerooni, Michael Sjoding, David Fouhey, Jenna Wiens\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.14509) [Code]()\n\n#### BeyondScene: Higher-Resolution Human-Centric Scene Generation With Pretrained Diffusion\nGwanghyun Kim, Hayeon Kim, Hoigi Seo, Dong Un Kang, Se Young Chun*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.04544) [Code]()\n\n#### Viewpoint textual inversion: discovering scene representations and 3D view control in 2D diffusion models\nJames Burgess*, Kuan-Chieh Wang, Serena Yeung-Levy\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2309.07986) [Code]()\n\n#### Loc3Diff: Local Diffusion for 3D Human Head Synthesis and Editing\nYushi Lan*, Feitong Tan, Qiangeng Xu, Di Qiu, Kyle Genova, Zeng Huang, Rohit Pandey, Sean Fanello, Thomas Funkhouser, Chen Change Loy, Yinda Zhang*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/08166.pdf) [Code]()\n\n#### Diff-Reg: Diffusion Model in Doubly Stochastic Matrix Space for Registration Problem\nQianliang Wu*, Haobo Jiang*, Lei Luo, Jun Li, Yaqing Ding*, Jin Xie*, Jian Yang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/pdf/2403.19919) [Code]()\n\n#### Investigating Style Similarity in Diffusion Models\nGowthami Somepalli*, Anubhav Gupta, Kamal Gupta, Shramay Palta, Micah Goldblum, Jonas A. Geiping, Abhinav Shrivastava, Tom Goldstein\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.01292) [Code]()\n\n#### Timestep-Aware Correction for Quantized Diffusion Models\nYuzhe Yao, Feng Tian, Jun Chen*, Haonan Lin, Guang Dai, Yong Liu, Jingdong Wang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.03917) [Code]()\n\n#### VQA-Diff: Exploiting VQA and Diffusion for Zero-Shot Image-to-3D Vehicle Asset Generation in Autonomous Driving\nYIBO LIU*, Zheyuan Yang, Guile Wu, Yuan Ren, Kejian Lin, Liu Bingbing, Yang Liu, JINJUN SHAN\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.06516) [Code]()\n\n#### Unmasking Bias in Diffusion Model Training\nHu Yu, Li Shen, Jie Huang, Hongsheng Li, Feng Zhao*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.08442) [Code]()\n\n#### Layered Rendering Diffusion Model for Controllable Zero-Shot Image Synthesis\nZipeng Qi, Guoxi Huang*, Chenyang Liu, Fei Ye\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.18435) [Code]()\n\n#### A Simple Background Augmentation Method for Object Detection with Diffusion Model\nYuhang Li, Xin Dong, Chen Chen, Weiming Zhuang, Lingjuan Lyu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.00350) [Code]()\n\n#### Safeguard Text-to-Image Diffusion Models with Human Feedback Inversion\nSanghyun Kim*, Seohyeon Jung, Balhae Kim, Moonseok Choi, Jinwoo Shin, Juho Lee*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.21032) [Code]()\n\n#### An Explainable Vision Question Answer Model via Diffusion Chain-of-Thought\nChunhao LU, Qiang Lu*, Jake Luo\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/08395.pdf) [Code]()\n\n#### FrePolad: Frequency-Rectified Point Latent Diffusion for Point Cloud Generation\nChenliang Zhou*, Fangcheng Zhong, Param Hanji, Zhilin Guo, Kyle Thomas Fogarty, Alejandro Sztrajman, Hongyun Gao, A. Cengiz Oztireli\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.12090) [Code]()\n\n#### GAMMA-FACE: GAussian Mixture Models Amend Diffusion Models for Bias Mitigation in Face Images\nBasudha Pal*, Arunkumar Kannan*, Ram Prabhakar Kathirvel, Alice O'Toole, Rama Chellappa\n\u003cbr\u003e\n[arXiv](https://bas-2k.github.io/gamma-face/) [Code]()\n\n#### PEA-Diffusion: Parameter-Efficient Adapter with Knowledge Distillation in non-English Text-to-Image Generation\njian ma, Chen Chen*, Qingsong Xie, Haonan Lu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17086) [Code]()\n\n#### Diffusion Model for Robust Multi-Sensor Fusion in 3D Object Detection and BEV Segmentation\nDuy Tho Le*, Hengcan Shi*, Jianfei Cai, Hamid Rezatofighi\n\u003cbr\u003e\n[arXiv](https://arxiv.org/html/2404.04629v1) [Code]()\n\n#### Self-Guided Generation of Minority Samples Using Diffusion Models\nSoobin Um, Jong Chul Ye*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.11555) [Code]()\n\n#### Pyramid Diffusion for Fine 3D Large Scene Generation\nYuheng Liu*, Xinke Li, Xueting Li, Lu Qi*, Chongshou Li, Ming-Hsuan Yang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.12085) [Code]()\n\n#### ShoeModel: Learning to Wear on the User-specified Shoes via Diffusion Model\nWenyu Li*, Binghui Chen, Yifeng Geng, Xuansong Xie, Wangmeng Zuo\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.04833) [Code]()\n\n#### A Watermark-Conditioned Diffusion Model for IP Protection\nRui Min*, Sen Li*, Hongyang Chen*, Minhao Cheng*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.10893) [Code]()\n\n#### Lost in Translation: Latent Concept Misalignment in Text-to-Image Diffusion Models\nJuntu Zhao, Junyu Deng, Yixin Ye, Chongxuan Li, Zhijie Deng*, Dequan Wang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.00230) [Code]()\n\n#### Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression\nAnimesh Sinha*, Bo Sun, Anmol Kalia, Arantxa Casanova, Elliot Blanchard, David Yan, Winnie Zhang, Tony Nelli, Jiahui Chen, Hardik Shah, Licheng Yu, Mitesh Kumar Singh, Ankit Ramchandani, Maziar Sanjabi, Sonal Gupta, Amy L Bearman, Dhruv Mahajan\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.10794) [Code]()\n\n#### GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection\nHang Yao, Ming Liu*, Zhicun Yin, Zifei Yan, Xiaopeng Hong, Wangmeng Zuo\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2406.07487) [Code]()\n\n#### CipherDM: Secure Three-Party Inference for Diffusion Model Sampling\nXin Zhao, Xiaojun Chen*, Xudong Chen, He Li, Tingyu Fan, Zhendong Zhao\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2409.05414) [Code]()\n\n#### Time-Efficient and Identity-Consistent Virtual Try-On Using A Variant of Altered Diffusion Models\nPhuong Hoang Dam*, Jihoon Jeong*, Anh T Tran*, Daeyoung Kim*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.07371) [Code]()\n\n#### Self-Rectifying Diffusion Sampling with Perturbed-Attention Guidance\nDonghoon Ahn, Hyoungwon Cho, Jaewon Min, Jungwoo Kim, Wooseok Jang, SeonHwa Kim, Hyun Hee Park, Kyong Hwan Jin*, Seungryong Kim*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.17377) [Code]()\n\n#### FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models\nJunhyuk So, Jungwon Lee, Eunhyeok Park*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.03517) [Code]()\n\n#### Diffusion for Out-of-Distribution Detection on Road Scenes and Beyond\nSilvio Galesso*, Philipp Schröppel*, Hssan Driss, Thomas Brox\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.15739) [Code]()\n\n#### MONTAGE: Monitoring Training for Attribution of Generative Diffusion Models\nJonathan Brokman*, Omer Hofman, Roman Vainshtein, Amit Giloni, Toshiya Shimizu, Inderjeet Singh, Oren Rachmil, Alon Zolfi, Asaf Shabtai, Yuki Unno, Hisashi Kojima\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/09513.pdf) [Code]()\n\n#### Style-Extracting Diffusion Models for Semi-Supervised Histopathology Segmentation\nMathias Öttl*, Frauke Wilm, Jana Steenpass, Jingna Qiu, Matthias Rübner, Prof Arndt Hartmann, Matthias W. Beckmann, Peter Fasching, Andreas K Maier, Ramona Erber, Bernhard Kainz, Katharina Breininger\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.14429) [Code]()\n\n#### Deep Diffusion Image Prior for Efficient OOD Adaptation in 3D Inverse Problems\nHyungjin Chung, Jong Chul Ye*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.10641) [Code]()\n\n#### LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model\nRunhui Huang, Kaixin Cai, Jianhua Han, Xiaodan Liang*, Renjing Pei, Guansong Lu, Songcen Xu, Wei Zhang, Hang Xu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.11929) [Code]()\n\n#### UpFusion: Novel View Diffusion from Unposed Sparse View Observations\nBharath Raj Nagoor Kani*, Hsin-Ying Lee, Sergey Tulyakov, Shubham Tulsiani\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.06661) [Code]()\n\n#### Video Editing via Factorized Diffusion Distillation\nUriel Singer*, Amit Zohar*, Yuval Kirstain, Shelly Sheynin, Adam Polyak, Devi Parikh, Yaniv Taigman\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.09334) [Code]()\n\n#### CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion\nWendi Zheng*, Jiayan Teng, Zhuoyi Yang, Weihan Wang, Jidong Chen, Xiaotao Gu, Yuxiao Dong*, Ming Ding*, Jie Tang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.05121) [Code]()\n\n#### SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers\nNanye Ma*, Mark Goldstein, Michael Albergo, Nicholas M Boffi, Eric Vanden-Eijnden*, Saining Xie*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2401.08740) [Code]()\n\n#### Curved Diffusion: A Generative Model With Optical Geometry Control\nAndrey Voynov*, Amir Hertz, Moab Arar, Shlomi Fruchter, Daniel Cohen-Or\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17609) [Code]()\n\n#### AnimateMe: 4D Facial Expressions via Diffusion Models\nDimitrios Gerogiannis*, Foivos Paraperas Papantoniou, Rolandos Alexandros Potamias, Alexandros Lattas, Stylianos Moschoglou, Stylianos Ploumpis, Stefanos Zafeiriou\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.17213) [Code]()\n\n#### Unveiling and Mitigating Memorization in Text-to-image Diffusion Models through Cross Attention\nJie Ren*, Yaxin Li, Shenglai Zeng, Han Xu, Lingjuan Lyu, Yue Xing, Jiliang Tang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.11052) [Code]()\n\n#### Context Diffusion: In-Context Aware Image Generation\nIvona Najdenkoska*, Animesh Sinha, Abhimanyu Dubey, Dhruv Mahajan, Vignesh Ramanathan, Filip Radenovic\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.03584) [Code]()\n\n#### Adaptive Compressed Sensing with Diffusion-Based Posterior Sampling\nNoam Elata*, Tomer Michaeli, Michael Elad\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.08256) [Code]()\n\n#### Data Augmentation via Latent Diffusion for Saliency Prediction\nBahar Aydemir*, Deblina Bhattacharjee, Tong Zhang, Mathieu Salzmann, Sabine Süsstrunk\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.07307) [Code]()\n\n#### A Diffusion Model for Simulation Ready Coronary Anatomy with Morpho-skeletal Control\nKarim Kadry*, Shreya Gupta, Jonas Sogbadji, Michiel Schaap, Kersten Petersen, Takuya Mizukami, Carlos Collet, Farhad R. Nezami, Elazer R Edelman\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.15631) [Code]()\n\n#### DrivingDiffusion: Layout-Guided Multi-View Driving Scenarios Video Generation with Latent Diffusion Model\nLi Xiaofan*, Zhang Yifu*, Ye Xiaoqing*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2310.07771) [Code]()\n\n#### GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction\nYuxuan Mu*, Xinxin Zuo, Chuan Guo, Yilin Wang, Juwei Lu, Xiaofei Wu, Songcen Xu, Peng Dai, Youliang Yan, Li Cheng\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.04237) [Code]()\n\n#### AdaDiff: Accelerating Diffusion Models through Step-Wise Adaptive Computation\nShengkun Tang*, Yaqing Wang, Caiwen Ding, Yi Liang, Yao Li, Dongkuan Xu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2309.17074) [Code]()\n\n#### Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas\nFabio Quattrini*, Vittorio Pippi, Silvia Cascianelli*, Rita Cucchiara\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.15660) [Code]()\n\n#### Photorealistic Video Generation with Diffusion Models\nAgrim Gupta*, Lijun Yu, Kihyuk Sohn, Xiuye Gu, Meera Hahn, Li Fei-Fei, Irfan Essa, Lu Jiang, Jose Lezama\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.06662) [Code]()\n\n#### WoVoGen: World Volume-aware Diffusion for Controllable Multi-camera Driving Scene Generation\nJiachen Lu, Ze Huang, Zeyu Yang, Zhang Jiahui, Li Zhang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.02934) [Code]()\n\n#### Soft Shadow Diffusion (SSD): Physics-inspired Learning for 3D Computational Periscopy\nFadlullah A Raji*, John Murray-Bruce*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/10427.pdf) [Code]()\n\n#### Tackling Structural Hallucination in Image Translation with Local Diffusion\nSeunghoi Kim*, Chen Jin, Tom Diethe, Matteo Figini, Henry FJ Tregidgo, Asher Mullokandov, Philip A Teare, Daniel Alexander\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.05980) [Code]()\n\n#### Adversarial Robustification via Text-to-Image Diffusion Models\nDaewon Choi, Jongheon Jeong, Huiwon Jang, Jinwoo Shin*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.18658) [Code]()\n\n#### Learning Quantized Adaptive Conditions for Diffusion Models\nYuchen Liang*, Yuchuan Tian, Lei Yu, Huaao Tang, Jie Hu, Xiangzhong Fang, Hanting Chen*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.17487) [Code]()\n\n#### SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher\nTrung Tuan Dao*, Thuan Hoang Nguyen, Thanh Van Le, Duc H Vu, Khoi Nguyen, Cuong Pham, Anh T Tran*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2408.14176) [Code]()\n\n#### DiffSurf: A Transformer-based Diffusion Model for Generating and Reconstructing 3D Surfaces in Pose\nYusuke Yoshiyasu*, Leyuan Sun\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2408.14860) [Code]()\n\n#### SlimFlow: Training Smaller One-Step Diffusion Models with Rectified Flow\nYuanzhi Zhu*, Xingchao Liu, Qiang Liu*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.12718) [Code]()\n\n#### DreamSampler: Unifying Diffusion Sampling and Score Distillation for Image Manipulation\nJeongsol Kim, Geon Yeong Park, Jong Chul Ye*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.11415) [Code]()\n\n#### PreciseControl: Enhancing Text-To-Image Diffusion Models with Fine-Grained Attribute Control\nRishubh Parihar*, Sachidanand VS, Sabariswaran Mani, Tejan Karmali, Venkatesh Babu RADHAKRISHNAN\n\u003cbr\u003e\n[arXiv](https://www.arxiv.org/abs/2408.05083) [Code]()\n\n#### Deep Reward Supervisions for Tuning Text-to-Image Diffusion Models\nXiaoshi Wu, Yiming Hao, Manyuan Zhang*, Keqiang Sun, Zhaoyang Huang, Guanglu Song, Yu Liu, Hongsheng Li*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2405.00760) [Code]()\n\n#### Inf-DiT: Upsampling any-resolution image with memory-efficient diffusion transformer\nZhuoyi Yang*, Heyang Jiang, Wenyi Hong, Jiayan Teng, Wendi Zheng, Yuxiao Dong, Ming Ding, Jie Tang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2405.04312) [Code]()\n\n#### EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions\nLinrui Tian*, Qi Wang*, Bang Zhang*, Liefeng Bo*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2402.17485) [Code]()\n\n#### Zero-Shot Adaptation for Approximate Posterior Sampling of Diffusion Models in Inverse Problems\nYasar U Alcalar*, Mehmet Akcakaya\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.11288) [Code]()\n\n#### R.A.C.E.: Robust Adversarial Concept Erasure for Secure Text-to-Image Diffusion Model\nChanghoon Kim*, Kyle Min*, Yezhou Yang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2405.16341) [Code]()\n\n#### Few-Shot Image Generation by Conditional Relaxing Diffusion Inversion\nYu Cao*, Shaogang Gong\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.07249) [Code]()\n\n#### A high-quality robust diffusion framework for corrupted dataset\nQuan Dao*, Binh Ta, Tung Pham, Anh Tran\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17101) [Code]()\n\n#### Identity-Consistent Diffusion Network for Grading Knee Osteoarthritis Progression in Radiographic Imaging\nWenhua Wu, Kun Hu*, Wenxi Yue, Wei Li, Milena Simic, Changyang Li, Wei Xiang, Zhiyong Wang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.21381) [Code]()\n\n#### Fast Training of Diffusion Transformer with Extreme Masking for 3D Point Clouds Generation\nShentong Mo, Enze Xie*, Yue Wu, Junsong Chen, Matthias Niessner, Zhenguo Li\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.07231) [Code]()\n\n#### Pix2Gif: Motion-Guided Diffusion for GIF Generation\nHitesh Kandala*, Jianfeng Gao, Jianwei Yang\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.04634) [Code]()\n\n#### T2IShield: Defending Against Backdoors on Text-to-Image Diffusion Models\nZhongqi Wang, Jie Zhang*, Shiguang Shan, Xilin Chen\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.04215) [Code]()\n\n#### DiffusionPen: Towards Controlling the Style of Handwritten Text Generation\nKonstantina Nikolaidou*, George Retsinas, Giorgos Sfikas, Marcus Liwicki\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2409.06065) [Code]()\n\n#### Learning Pseudo 3D Guidance for View-consistent Texturing with 2D Diffusion\nKehan Li, Yanbo Fan*, Yang Wu, Zhongqian Sun, Wei Yang, Xiangyang Ji, Li Yuan, Jie Chen*\n\u003cbr\u003e\n[arXiv](https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/11528.pdf) [Code]()\n\n#### Enhancing Semantic Fidelity in Text-to-Image Synthesis: Attention Regulation in Diffusion Models\nYang Zhang*, Tze Tzun Teoh, Wei Hern Lim, Kenji Kawaguchi\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.06381) [Code]()\n\n#### Adversarial Diffusion Distillation\nAxel Sauer*, Dominik Lorenz, Andreas Blattmann, Robin Rombach\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2311.17042) [Code]()\n\n#### Improving Diffusion Models for Authentic Virtual Try-on in the Wild\nYisol Choi*, Sangkyung Kwak, Kyungmin Lee, Hyungwon Choi, Jinwoo Shin*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.05139) [Code]()\n\n#### Fast Diffusion-Based Counterfactuals for Shortcut Removal and Generation\nNina Weng*, Paraskevas Pegios, Eike Petersen, Aasa Feragen, Siavash Arjomand Bigdeli\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.14223) [Code]()\n\n#### Iterative Ensemble Training with Anti-Gradient Control for Mitigating Memorization in Diffusion Models\nXiao Liu, Xiaoliu Guan, Yu Wu*, Jiaxu Miao*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2407.15328) [Code]()\n\n#### DiffClass: Diffusion-Based Class Incremental Learning\nZichong Meng, Jie Zhang, Changdi Yang, Zheng Zhan, Pu Zhao*, Yanzhi Wang*\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2403.05016) [Code]()\n\n#### Instant 3D Human Avatar Generation using Image Diffusion Models\nNikos Kolotouros*, Thiemo Alldieck, Enric Corona, Eduard Gabriel Bazavan, Cristian Sminchisescu\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2406.07516) [Code]()\n\n#### Concept Arithmetics for Circumventing Concept Inhibition in Diffusion Models\nVitali Petsiuk*, Kate Saenko\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2404.13706) [Code]()\n\n#### ControlNet-XS: Rethinking the Control of Text-to-Image Diffusion Models as Feedback-Control Systems\nDenis Zavadski*, Johann-Friedrich Feiden, Carsten Rother\n\u003cbr\u003e\n[arXiv](https://arxiv.org/abs/2312.06573) [Code]()\n\n#### Hierarchical Conditioning of Diffusion Models Using Tree-of-Life for Studying Species Evolution\nMridul Khurana*, Arka Daw, M. Maruf, Josef C. Uyeda, Wasila Dahdul, Caleb Charpentier, Yasin Bakış, Henry L. Bart Jr., Paula M. Mabee, Hilmar Lapp, James P. Balhoff, Wei-Lun Chao, Charles Stewart, Tanya Berger-Wolf, Anuj Karpatne*\n\u003cbr\u003e ![Poster Badge](https://img.shields.io/badge/Poster-purple) [arXiv](https://arxiv.org/abs/2408.00160) [Code]()\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fmoatifbutt%2Fawesome-diffusion-eccv-2024","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fmoatifbutt%2Fawesome-diffusion-eccv-2024","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fmoatifbutt%2Fawesome-diffusion-eccv-2024/lists"}