Richard Zhang - Research Scientist, Adobe Research

Richard Zhang

Principal Scientist
Adobe Research
San Francisco, CA

rizhang at adobe.com
[GitHub] [Google Scholar]
[Resume/CV] [Twitter] [Bio]

My research interests are in computer vision, machine learning, deep learning, graphics, and image processing. I obtained a PhD at UC Berkeley, advised by Prof. Alexei (Alyosha) Efros. I obtained BS and MEng degrees from Cornell University in ECE. I often collaborate with academic researchers, either through internships or university collaboration.

News

[Feb 2026] ID-Sim, Self-Eval, Group Diffusion were accepted to CVPR 2026.
[Jan 2026] MotionStream, REPA-E, and NP-Edit were accepted to ICLR 2026.
[Jun 2025] Long-Context video models and SliderSpace were accepted to ICCV 2025.
[Feb 2025] CausVid and VideoGigaGAN were accepted to CVPR 2025.
[Sept 2024] Attribution by Unlearning and DMDv2 were accepted to NeurIPS 2024.
[Aug 2024] Check out TurboEdit, accepted to ECCV 2024.
[Jul 2024] Diffusion2GAN, Lazy Diffusion, and Editable Image Elements were accepted to ECCV 2024.
[Apr 2024] I'll be speaking at GenAI Media Challenge and Fair, Data-Efficient, and Trusted Computer Vision workshops.

Publications

	ID-Sim: An Identity-Focused Similarity Metric Julia Chae, Nicholas Kolkin, Jui-Hsien Wang, Richard Zhang, Sara Beery, Cusuh Ham In CVPR, 2026. [Paper] [Webpage]
	Self-Evaluation Unlocks Any-Step Text-to-Image Generation Xin Yu, Xiaojuan Qi, Zhengqi Li, Kai Zhang, Richard Zhang, Zhe Lin, Eli Shechtman, Tianyu Wang, Yotam Nitzan In CVPR, 2026. [Paper] [Webpage]
	Group Diffusion: Enhancing Image Generation by Unlocking Cross-Sample Collaboration Sicheng Mo, Thao Nguyen, Richard Zhang, Nicholas Kolkin, Siddharth S. Iyer, Eli Shechtman, Krishna Kumar Singh, Yong Jae Lee, Bolei Zhou, Yuheng Li In CVPR, 2026. [Paper] [Webpage]
	Towards Text-Guided Attribute-Disentangled Multimodal Representation Learning Yibing Wei, Sudeep Katakol, Manuel Brack, Jinhong Lin, Haoyue Bai, Yu-Teng Li, Richard Zhang, Eli Shechtman, Hareesh Ravi, Ajinkya Kale In CVPR Findings, 2026. [Paper] [Supp] [Code] [Dataset] [Poster]
	End-to-End Training for Unified Tokenization and Latent Denoising Shivam Duggal, Xingjian Bai, Zongze Wu, Richard Zhang, Eli Shechtman, Antonio Torralba, Phillip Isola, William T. Freeman In ArXiv, 2026. [Paper] [Webpage] [Code]
	MotionStream: Real-Time Video Generation with Interactive Motion Controls Joonghyuk Shin, Zhengqi Li, Richard Zhang, Jun-Yan Zhu, Jaesik Park, Eli Shechtman, Xun Huang In ICLR (oral), 2026. [Paper] [Webpage]
	What matters for Representation Alignment: Global Information or Spatial Structure? Jaskirat Singh, Xingjian Leng, Zongze Wu, Liang Zheng, Richard Zhang, Eli Shechtman, Saining Xie, In ICLR, 2026. [Paper] [Webpage] [Code]
	NP-Edit: Learning an Image Editing Model without Image Editing Pairs Nupur Kumari, Sheng-Yu Wang, Nanxuan Zhao, Yotam Nitzan, Yuheng Li, Krishna Kumar Singh, Richard Zhang, Eli Shechtman, Jun-Yan Zhu, Xun Huang In ICLR, 2026. [Paper] [Webpage]
	Beyond Simple Edits: X-Planner for Complex Instruction-Based Image Editing Chun-Hsiao Yeh, Yilin Wang, Nanxuan Zhao, Richard Zhang, Yuheng Li, Yi Ma, Krishna Kumar Singh In AAAI, 2026. [Paper] [Webpage]
	Fast Data Attribution for Text-to-Image Models Sheng-Yu Wang, Aaron Hertzmann, Alexei A. Efros, Richard Zhang, Jun-Yan Zhu In NeurIPS, 2025. [Paper] [Webpage]
	Long-Context State-Space Video World Models Ryan Po, Yotam Nitzan, Richard Zhang, Berlin Chen, Tri Dao, Eli Shechtman, Gordon Wetzstein, Xun Huang In ICCV, 2025. [Paper] [Webpage]
	SliderSpace: Decomposing the Visual Capabilities of Diffusion Models Rohit Gandikota, Zongze Wu, Richard Zhang, David Bau, Eli Shechtman, Nick Kolkin In ICCV, 2025. [Paper] [Webpage] [GitHub] [Demo]
	From Slow Bidirectional to Fast Causal Video Generators Tianwei Yin, Qiang Zhang, Richard Zhang, William T. Freeman, Fredo Durand, Eli Shechtman, Xun Huang In CVPR, 2025. [Paper] [Webpage]
	VideoGigaGAN: Towards Detail-rich Video Super-Resolution Yiran Xu, Taesung Park, Richard Zhang, Yang Zhou, Eli Shechtman, Feng Liu, Jia-Bin Huang, Difan Liu In CVPR, 2025. [Paper] [Webpage] [Bibtex]
	What Makes for a Good Stereoscopic Image? Netanel Y. Tamir, Shir Amir, Ranel Itzhaky, Noam Atia, Shobhita Sundaram, Stephanie Fu, Ron Sokolovsky, Phillip Isola, Tali Dekel, Richard Zhang, Miriam Farber In CVPR CV4Metaverse Workshop, 2025. [Paper] [GitHub] [Bibtex]
	Data Attribution for Text-to-Image Models by Unlearning Synthesized Images Sheng-Yu Wang, Aaron Hertzmann, Alexei A. Efros, Jun-Yan Zhu, Richard Zhang In NeurIPS, 2024. [Paper] [Webpage]
	Improved Distribution Matching Distillation for Fast Image Synthesis Tianwei Yin, Michael Gharbi, Taesung Park, Richard Zhang, Eli Shechtman, Fredo Durand, William T. Freeman In NeurIPS (oral), 2024. [Paper] [Webpage] [Bibtex]
	Customizing Text-to-Image Diffusion with Camera Viewpoint Control Nupur Kumari, Grace Su, Richard Zhang, Taesung Park, Eli Shechtman, Jun-Yan Zhu In SIGGRAPH Asia, 2024. [Paper] [Webpage] [GitHub] [Demo]
	NewMove: Customizing text-to-video models with novel motions Joanna Materzynska, Josef Sivic, Eli Shechtman, Antonio Torralba, Richard Zhang, Bryan Russell In ACCV, 2024. [Paper] [Webpage] [Bibtex]
	TurboEdit: Instant text-based image editing Zongze Wu, Nicholas Kolkin, Jonathan Brandt, Richard Zhang, Eli Shechtman In ECCV, 2024. [Paper] [Webpage]
	Diffusion2GAN: Distilling Diffusion Models into Conditional GANs Minguk Kang, Richard Zhang, Connelly Barnes, Sylvain Paris, Suha Kwak, Jaesik Park, Eli Shechtman, Jun-Yan Zhu, Taesung Park In ECCV, 2024. [Paper] [Webpage] [Bibtex]
	Editable Image Elements for Controllable Synthesis Jiteng Mu, Michael Gharbi, Richard Zhang, Eli Shechtman, Nuno Vasconcelos, Xiaolong Wang, Taesung Park, In ECCV, 2024. [Paper] [Webpage]
	Lazy Diffusion Transformer for Interactive Image Editing Yotam Nitzan, Zongze Wu, Richard Zhang, Eli Shechtman, Daniel Cohen-Or, Taesung Park, Michael Gharbi In ECCV, 2024. [Paper] [Webpage]
	Mixture of Efficient Diffusion Experts Through Automatic Interval and Sub-Network Selection Alireza Ganjdanesh, Yan Kang, Yuchen Liu, Richard Zhang, Zhe Lin, Heng Huang In ECCV, 2024. [Paper]
	What Makes for a Good Stereoscopic Image? Netanel Y. Tamir, Shir Amir, Ranel Itzhaky, Noam Atia, Shobhita Sundaram, Stephanie Fu, Ron Sokolovsky, Phillip Isola, Tali Dekel, Richard Zhang, Miriam Farber In Arxiv, 2024. [Paper]
	One-step Diffusion with Distribution Matching Distillation Tianwei Yin, Michael Gharbi, Richard Zhang, Eli Shechtman, Fredo Durand, William T. Freeman, Taesung Park In CVPR, 2024. [Paper] [Webpage] [Teaser] [Bibtex]
	Personalized Residuals for Concept-Driven Text-to-Image Generation Cusuh Ham, Matthew Fisher, James Hays, Nick Kolkin, Yuchen Liu, Richard Zhang, Tobias Hinz In CVPR, 2024. [Paper] [Webpage] [Bibtex]
	Image Neural Field Diffusion Models Yinbo Chen, Oliver Wang, Richard Zhang, Eli Shechtman, Xiaolong Wang, Michael Gharbi In CVPR, 2024 (highlight). [Paper] [Webpage]
	Jump Cut Smoothing for Talking Heads Xiaojuan Wang, Taesung Park, Yang Zhou, Eli Shechtman, Richard Zhang In ArXiv, 2024. [Paper] [Webpage]
	DreamSim: Learning New Dimensions of Human Visual Similarity using Synthetic Data Stephanie Fu, Netanel Tamir, Shobhita Sundaram, Lucy Chai, Richard Zhang, Tali Dekel, Phillip Isola (equal contribution) In NeurIPS (spotlight), 2023. [Paper] [Webpage] [GitHub] [Bibtex]
	Evaluating Data Attribution for Text-to-Image Models Sheng-Yu Wang, Alexei A. Efros, Jun-Yan Zhu, Richard Zhang In ICCV, 2023. [Paper] [Webpage] [GitHub] [Bibtex]
	Ablating Concepts in Text-to-Image Diffusion Models Nupur Kumari, Bingliang Zhang, Sheng-Yu Wang, Eli Shechtman, Richard Zhang, Jun-Yan Zhu In ICCV, 2023. [Paper] [Webpage] [GitHub] [Bibtex]
	Online Detection of AI-Generated Images David C. Epstein, Ishan Jain, Oliver Wang, Richard Zhang In ICCV DFAD Workshop, 2023. [Paper] [Webpage] [Slides] [Poster] [Bibtex]
	Zero-shot Image-to-Image Translation Gaurav Parmar, Krishna Kumar Singh, Richard Zhang, Yijun Li, Jingwan Lu, Jun-Yan Zhu In SIGGRAPH, 2023. [Paper] [Webpage] [GitHub] [Demo]
	Scaling up GANs for Text-to-Image Synthesis Minguk Kang, Jun-Yan Zhu, Richard Zhang, Jaesik Park, Eli Shechtman, Sylvain Paris, Taesung Park In CVPR (highlight), 2023. [Paper] [Webpage] [Bibtex]
	Multi-Concept Customization of Text-to-Image Diffusion Nupur Kumari, Bingliang Zhang, Richard Zhang, Eli Shechtman, Jun-Yan Zhu In CVPR, 2023. [Paper] [Webpage] [GitHub] [Bibtex]
	Domain Expansion of Image Generators Yotam Nitzan, Michaël Gharbi, Richard Zhang, Taesung Park, Jun-Yan Zhu, Daniel Cohen-Or, Eli Shechtman In CVPR, 2023. [Paper] [Webpage] [GitHub] [Bibtex]
	The Low-Rank Simplicity Bias in Deep Networks Minyoung Huh, Hossein Mobahi, Richard Zhang, Brian Cheung, Pulkit Agrawal, Phillip Isola In TMLR, 2023. [Paper] [Webpage] [GitHub] [Bibtex]
	Any-resolution Training for High-resolution Image Synthesis Lucy Chai, Michaël Gharbi, Eli Shechtman, Phillip Isola, Richard Zhang In ECCV, 2022. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	BlobGAN: Spatially Disentangled Scene Representations Dave Epstein, Taesung Park, Richard Zhang, Eli Shechtman, Alexei A. Efros In ECCV, 2022. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	3D-FM GAN: Towards 3D-Controllable Face Manipulation Yuchen Liu, Zhixin Shu, Yijun Li, Zhe Lin, Richard Zhang, Sun-Yuan Kung In ECCV, 2022. [Paper] [Webpage] [Video]
	ASSET: Autoregressive Semantic Scene Editing with Transformers at High Resolutions Difan Liu, Sandesh Shetty, Tobias Hinz, Matthew Fisher, Richard Zhang, Taesung Park, Evangelos Kalogerakis In SIGGRAPH, 2022. [Paper] [Webpage] [GitHub] [Bibtex]
	GAN-Supervised Dense Visual Alignment William Peebles, Jun-Yan Zhu, Richard Zhang, Alexei A. Efros, Antonio Torralba, Eli Shechtman In CVPR (oral, best paper finalist), 2022. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	Ensembling Off-the-shelf Models for GAN Training Nupur Kumari, Richard Zhang, Eli Shechtman, Jun-Yan Zhu In CVPR (oral), 2022. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	Spatially-Adaptive Multilayer Selection for GAN Inversion and Editing Gaurav Parmar, Yijun Li, Jingwan Lu, Richard Zhang, Jun-Yan Zhu, Krishna Kumar Singh In CVPR, 2022. [Paper] [Webpage] [GitHub] [Bibtex]
	On Aliased Resizing Libraries and Surprising Subtleties in FID Calculation Gaurav Parmar, Richard Zhang, Jun-Yan Zhu In CVPR, 2022. [Paper] [Webpage] [GitHub] [Bibtex]
	Editing Conditional Radiance Fields Steven Liu, Xiuming Zhang, Zhoutong Zhang, Richard Zhang, Jun-Yan Zhu, Bryan Russell In ICCV, 2021. [Paper] [Webpage] [GitHub] [Video] [Demo] [Bibtex]
	Contrastive Feature Loss for Image Prediction Alex Andonian, Taesung Park, Bryan Russell, Phillip Isola, Jun-Yan Zhu, Richard Zhang. In ICCV AIM Workshop, 2021. [Paper] [GitHub] [Bibtex]
	Ensembling with Deep Generative Views Lucy Chai, Jun-Yan Zhu, Eli Shechtman, Phillip Isola, Richard Zhang In CVPR, 2021. [Paper] [Webpage] [GitHub] [Video] [Colab] [Bibtex]
	Few-shot Image Generation via Cross-domain Correspondence Utkarsh Ojha, Yijun Li, Jingwan Lu, Alexei A. Efros, Yong Jae Lee, Eli Shechtman, Richard Zhang In CVPR, 2021. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	Anycost GANs for Interactive Image Synthesis and Editing Ji Lin, Richard Zhang, Frieder Ganz, Song Han, Jun-Yan Zhu In CVPR, 2021. [Paper] [Webpage] [Video] [GitHub] [Bibtex]
	Spatially-Adaptive Pixelwise Networks for Fast Image Translation Tamar Rott Shaham, Michaël Gharbi, Richard Zhang, Eli Shechtman, Tomer Michaeli In CVPR, 2021. [Paper] [Webpage] [Bibtex]
	CDPAM: Contrastive Learning for Perceptual Audio Similarity Pranay Manocha, Zeyu Jin, Richard Zhang, Adam Finkelstein In ICASSP, 2021. [Paper] [Webpage] [GitHub] [Bibtex]
	Swapping Autoencoder for Deep Image Manipulation Taesung Park, Jun-Yan Zhu, Oliver Wang, Jingwan Lu, Eli Shechtman, Alexei A. Efros, Richard Zhang In NeurIPS, 2020. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	Few-shot Image Generation with Elastic Weight Consolidation Yijun Li, Richard Zhang, Jingwan Lu, Eli Shechtman In NeurIPS, 2020. [Paper] [Supplemental] [Webpage] [Bibtex]
	Contrastive Learning for Unpaired Image-to-Image Translation Taesung Park, Alexei A. Efros, Richard Zhang, Jun-Yan Zhu In ECCV, 2020. [Paper] [Webpage] [GitHub] [Teaser] [Video] [Bibtex]
	Transforming and Projecting Images into Class-conditional Generative Networks Minyoung Huh, Richard Zhang, Jun-Yan Zhu, Sylvain Paris, Aaron Hertzmann In ECCV (oral), 2020. [Paper] [Webpage] [GitHub] [Bibtex]
	A Differentiable Perceptual Audio Metric Learned from Just Noticeable Differences Pranay Manocha, Adam Finkelstein, Richard Zhang, Nicholas J. Bryan, Gautham J. Mysore, Zeyu Jin In Interspeech, 2020. [Paper] [Webpage] [GitHub] [Bibtex]
	CNN-generated images are surprisingly easy to spot...for now Sheng-Yu Wang, Oliver Wang, Richard Zhang, Andrew Owens, Alexei A. Efros In CVPR, 2020 (oral). [Paper] [Webpage] [GitHub] [Talk] [Bibtex]
	Deep Parametric Shape Predictions using Distance Fields Dmitriy Smirnov, Matthew Fisher, Vladimir G. Kim, Richard Zhang, Justin Solomon In CVPR, 2020. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	Image Morphing with Perceptual Constraints and STN Alignment Noa Fish, Richard Zhang, Lilach Perry, Daniel Cohen-Or, Eli Shechtman, Connelly Barnes In CGF, 2020. [Paper] [GitHub] [Bibtex]
	Making Convolutional Networks Shift-Invariant Again Richard Zhang In ICML, 2019. [Paper] [Webpage] [GitHub] [Talk] [Slides (129mb)] [Poster] [Bibtex]
	Detecting Photoshopped Faces by Scripting Photoshop Sheng-Yu Wang, Oliver Wang, Andrew Owens, Richard Zhang, Alexei A. Efros In ICCV, 2019. [Paper] [Webpage] [GitHub] [Video] [Poster] [Adobe Max] [Adobe Blog] [Bibtex]
	Interactive Sketch & Fill: Multiclass Sketch-to-Image Translation Arnab Ghosh, Richard Zhang, Puneet Dokania, Oliver Wang, Alexei A. Efros, Philip H.S. Torr, Eli Shechtman In ICCV, 2019. [Paper] [Webpage] [GitHub] [Video] [Bibtex]
	The Unreasonable Effectiveness of Deep Features as a Perceptual Metric Richard Zhang, Phillip Isola, Alexei A. Efros, Eli Shechtman, Oliver Wang In CVPR, 2018. [Paper] [Webpage] [GitHub] [Poster] [Adobe Blog] [Two Min Papers] [Bibtex]
	Stochastic Adversarial Video Prediction Alex X. Lee, Richard Zhang, Frederik Ebert, Pieter Abbeel, Chelsea Finn, Sergey Levine In ArXiv, 2018. [Paper] [Webpage] [GitHub] [Bibtex]
	Toward Multimodal Image-to-Image Translation Jun-Yan Zhu, Richard Zhang, Deepak Pathak, Trevor Darrell, Alexei A. Efros, Oliver Wang, Eli Shechtman In NIPS, 2017. [Paper] [Webpage] [GitHub] [Video (YouTube)(mp4)] [Poster] [Two Min Papers] [Bibtex]
	Real-Time User-Guided Image Colorization with Learned Deep Priors Richard Zhang, Jun-Yan Zhu, Phillip Isola, Xinyang Geng, Angela S. Lin, Tianhe Yu, Alexei A. Efros (*equal contribution) In SIGGRAPH, 2017. [Paper] [Webpage] [Fastforward] [Talk] [Video (YouTube)(mp4)] [PSE 2020] [GitHub] [Slides (141mb)] [Bibtex]
	Split-Brain Autoencoders: Unsupervised Learning by Cross-Channel Prediction Richard Zhang, Phillip Isola, Alexei A. Efros In CVPR, 2017. [Paper] [Webpage] [GitHub] [Poster] [Seminar Talk] [Bibtex]
	Colorful Image Colorization Richard Zhang, Phillip Isola, Alexei A. Efros In ECCV, 2016 (oral). [Paper] [Webpage] [GitHub] [Talk] [Slides (138mb)] [Poster] [Bibtex]
	Sensor Fusion for Semantic Segmentation of Urban Scenes Richard Zhang, Stefan Candra, Kai Vetter, Avideh Zakhor In ICRA, 2015. [Paper (pdf)(official)] [Slides] [Poster] [Talk] [Annotations (tar)(zip) ] [Bibtex]
	Automatic Identification of Window Regions on Indoor Point Clouds Using LiDAR and Cameras Richard Zhang, Avideh Zakhor In WACV, 2014. [Paper (pdf)(official)] [Bibtex]

Thesis

Image Synthesis for Self-Supervised Visual Representation Learning
Richard Zhang
Spring 2018.
[Thesis] [Dissertation Talk] [Fast Forward] [Slides (396 MB)] [Bibtex]

Organization, Committees

CVPR 2020, 2021, 2023, 2024, 2025, 2026 (Area Chair)
ECCV 2024 (Area Chair)
BMVC 2022 (Area Chair)
Sketching for Human Expressivity (SHE) at ECCV 2022 (co-organizer)
Advances in Image Manipulation (AIM) at ICCV 2019 (co-organizer)

Awards

MIT Technology Review, 35 Innovators Under 35, 2023
Reviewer recognitions, CVPR 2019, NeurIPS 2019, ECCV 2020, NeurIPS 2020, ECCV 2022
Thesis Fast Forward, Best Presentation, SIGGRAPH 2018
Adobe Research Fellowship 2017

Media

Please see this Adobe blog post, overview video (5 min), or TWiML podcast below (40 min) for more on our work on perception, generation, and forensics for GenAI.

Student collaborators/interns

I have gotten to work with some wonderful collaborators.

@Adobe

PhD/MS [interns]
Masters/Undergrad [interns]
PhD/MS [university collaborators]

@Berkeley

Undergraduates

Teaching

Introduction to Artificial Intelligence (CS 188), UC Berkeley
Graduate Student Instructor (GSI) with Prof. Anca Dragan
Spring 2017

Computer Vision (CS 280), UC Berkeley
Graduate Student Instructor (GSI) with Prof. Alexei A. Efros, Prof. Trevor Darrell
Spring 2016

Introduction to Circuits (ECE 2100), Cornell University
Teaching Assistant (TA) with Prof. Alyosha Molnar
Spring 2010

My Name

Confused by the contents of this page? Well, you may have been looking for Professor Richard Zhang or Professor Richard Zhang. My Chinese name is 章睿嘉.