Surveys & Thesis

Agrawal, Tejas Prakash. "RadGraph: Integrating Fine-Grained and Global Features using GCNs and LLMs." PhD diss., Faculty of the Graduate School of the University at Buffalo, The State University of New York, 2024. [PDF]
Vision-Language Models for Medical Report Generation and Visual Question Answering: A Review, Iryna Hartsock, Ghulam Rasool [Paper]
Sloan, Phillip, et al. "Automated Radiology Report Generation: A Review of Recent Advances." IEEE Reviews in Biomedical Engineering (2024). [Paper]
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge, [Paper]

Big Project

https://sites.research.google/med-palm/

Year 2024

Towards Interpretable Radiology Report Generation via Concept Bottlenecks using a Multi-Agentic RAG, Hasan Md Tusfiqur Alam, Devansh Srivastav, Md Abdul Kadir, Daniel Sonntag [Paper]
HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation, Tengfei Liu, Jiapu Wang, Yongli Hu, Mingjie Li, Junfei Yi, Xiaojun Chang, Junbin Gao, Baocai Yin [Paper]
LLM-RG4: Flexible and Factual Radiology Report Generation across Diverse Input Contexts, Zhuhao Wang, Yihua Sun, Zihan Li, Xuan Yang, Fang Chen, Hongen Liao [Paper]
[arXiv:2412.13599] Unlocking the Potential of Weakly Labeled Data: A Co-Evolutionary Learning Framework for Abnormality Detection and Report Generation [Paper]
[AAAI 2025, arXiv:2412.08901] Radiology Report Generation via Multi-objective Preference Optimization, Ting Xiao, Lei Shi, Peng Liu, Zhe Wang, Chenjia Bai, [Paper]
[arXiv:2411.18672] FactCheXcker: Mitigating Measurement Hallucinations in Chest X-ray Report Generation Models, Alice Heiman, Xiaoman Zhang, Emma Chen, Sung Eun Kim, Pranav Rajpurkar [Paper]
MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement, Xiwei Deng, Xianchun He, Yudan Zhou, Shuhui Cai, Congbo Cai, Zhong Chen [Paper]
[ACCV 2024] FG-CXR: A Radiologist-Aligned Gaze Dataset for Enhancing Interpretability in Chest X-Ray Report Generation, Trong Thang Pham, Ngoc-Vuong Ho, Nhat-Tan Bui, Thinh Phan, Patel Brijesh, Donald Adjeroh, Gianfranco Doretto, Anh Nguyen, Carol C. Wu, Hien Nguyen, Ngan Le [Paper]
[arXiv:2411.15539] Large Language Model with Region-guided Referring and Grounding for CT Report Generation, Zhixuan Chen, Yequan Bie, Haibo Jin, Hao Chen [Paper]
[arXiv:2411.16523] LaB-RAG: Label Boosted Retrieval Augmented Generation for Radiology Report Generation, Steven Song, Anirudh Subramanyam, Irene Madejski, Robert L. Grossman [Paper] [Code]
[ML4H 2024, arXiv:2411.11362] MAIRA-Seg: Enhancing Radiology Report Generation with Segmentation-Aware Multimodal Large Language Models, Harshita Sharma, Valentina Salvatelli, Shaury Srivastav, Kenza Bouzid, Shruthi Bannur, Daniel C. Castro, Maximilian Ilse, Sam Bond-Taylor, Mercy Prasanna Ranjit, Fabian Falck, Fernando Pérez-García, Anton Schwaighofer, Hannah Richardson, Maria Teodora Wetscherek, Stephanie L. Hyland, Javier Alvarez-Valle, Proceedings Paper at ML4H 2024 [Paper]
[arXiv:2411.10789] Anatomy-Guided Radiology Report Generation with Pathology-Aware Regional Prompts, Yijian Gao, Dominic Marshall, Xiaodan Xing, Junzhi Ning, Giorgos Papanastasiou, Guang Yang, Matthieu Komorowski [Paper]
[arXiv:2411.15122] ReXrank: A Public Leaderboard for AI-Powered Radiology Report Generation, Xiaoman Zhang, Hong-Yu Zhou, Xiaoli Yang, Oishi Banerjee, Julián N. Acosta, Josh Miller, Ouwen Huang, Pranav Rajpurkar [Paper] [Leaderboard]
VILA-M3: Enhancing Vision-Language Models with Medical Expert Knowledge, Vishwesh Nath, Wenqi Li, Dong Yang, Andriy Myronenko, Mingxin Zheng, Yao Lu, Zhijian Liu, Hongxu Yin, Yee Man Law, Yucheng Tang, Pengfei Guo, Can Zhao, Ziyue Xu, Yufan He, Greg Heinrich, Stephen Aylward, Marc Edgar, Michael Zephyr, Pavlo Molchanov, Baris Turkbey, Holger Roth, Daguang Xu [Paper]
[WACV 2025] ORID: Organ-Regional Information Driven Framework for Radiology Report Generation, Tiancheng Gu, Kaicheng Yang, Xiang An, Ziyong Feng, Dongnan Liu, Weidong Cai [Paper]
[ACM MM 2024]Divide and Conquer: Isolating Normal-Abnormal Attributes in Knowledge Graph-Enhanced Radiology Report Generation, Xiao Liang, Yanlei Zhang, Di Wang, Haodi Zhong, Ronghan Li, Quan Wang [Paper] [Code]
MCL: Multi-view Enhanced Contrastive Learning for Chest X-ray Report Generation, Kang Liu, Zhuoqi Ma, Kun Xie, Zhicheng Jiao, Qiguang Miao [Paper] [Code]
Decoding Report Generators: A Cyclic Vision-Language Adapter for Counterfactual Explanations, [Paper]
PadChest-GR: A Bilingual Chest X-ray Dataset for Grounded Radiology Report Generation, [Paper] [Project]
[AAAI24] Automatic Radiology Reports Generation via Memory Alignment Network, Hongyu Shen, Mingtao Pei, Juncai Liu, Zhaoxing Tian [Paper]
Designing a Robust Radiology Report Generation System, Sonit Singh [Paper]
[NeurIPS24] BenchX: A Unified Benchmark Framework for Medical Vision-Language Pretraining on Chest X-Rays, Yang Zhou, Tan Li Hui Faith, Yanyu Xu, Sicong Leng, Xinxing Xu, Yong Liu, Rick Siow Mong Goh [Paper] [Code]
[ISBI2025] R2Gen-Mamba: A Selective State Space Model for Radiology Report Generation, Yongheng Sun, Yueh Z. Lee, Genevieve A. Woodard, Hongtu Zhu, Chunfeng Lian, Mingxia Liu [Paper]
[MICCAI 2024] Structural Entities Extraction and Patient Indications Incorporation for Chest X-ray Report Generation, Kang Liu, Zhuoqi Ma, Xiaolu Kang, Zhusi Zhong, and Qiguang Miao [Paper] [Code]
[ECCV 2024] ChEX: Interactive Localization and Region Description in Chest X-rays, Philip Müller, Georgios Kaissis, and Daniel Rueckert [Paper] [Code]
[ECCV 2024] MedRAT: Unpaired Medical Report Generation via Auxiliary Tasks, [Paper] [Code]
InVERGe: Intelligent Visual Encoder for Bridging Modalities in Report Generation, Ankan Deria, Komal Kumar, Snehashis Chakraborty, Dwarikanath Mahapatra, Sudipta Roy; Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops, 2024, pp. 2028-2038 [Paper]
Fact-Aware Multimodal Retrieval Augmentation for Accurate Medical Radiology Report Generation, Liwen Sun, James Zhao, Megan Han, Chenyan Xiong [Paper]
Jeong, Jaehwan, et al. "Multimodal image-text matching improves retrieval-based chest x-ray report generation." Medical Imaging with Deep Learning. PMLR, 2024. [Paper]
[arXiv:2409.13321] SLaVA-CXR: Small Language and Vision Assistant for Chest X-ray Report Automation, Jinge Wu, Yunsoo Kim, Daqian Shi, David Cliffton, Fenglin Liu, Honghan Wu [Paper]
[arXiv:2408.15915] Leveraging Open Knowledge for Advancing Task Expertise in Large Language Models, Yuncheng Yang, Yulei Qin, Tong Wu, Zihan Xu, Gang Li, Pengcheng Guo, Hang Shao, Yuchen Shi, Ke Li, Xing Sun, Jie Yang, Yun Gu [Paper]
[arXiv:2409.05370v1] KARGEN: Knowledge-enhanced Automated Radiology Report Generation Using Large Language Models, Yingshu Li, Zhanyu Wang, Yunyi Liu, Lei Wang, Lingqiao Liu, and Luping Zhou [Paper]
[arXiv:2405.04175] Topicwise Separable Sentence Retrieval for Medical Report Generation, Junting Zhao, Yang Zhou, Zhihao Chen, Huazhu Fu, Liang Wan [Paper]
Fan, Yijian, Zhenbang Yang, Rui Liu, Mingjie Li, and Xiaojun Chang. "Medical Report Generation Is A Multi-label Classification Problem." arXiv preprint arXiv:2409.00250 (2024). [Paper]
[arXiv:2403.05396] HistGen: Histopathology Report Generation via Local-Global Feature Encoding and Cross-modal Context Interaction, Zhengrui Guo, Jiabo Ma, Yingxue Xu, Yihui Wang, Liansheng Wang, and Hao Chen [Paper]
[arXiv:2408.14397] Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs, Xiaoman Zhang, Julián N. Acosta, Hong-Yu Zhou, Pranav Rajpurkar [Paper] [Code]
[arXiv:2408.12141] TRRG: Towards Truthful Radiology Report Generation With Cross-modal Disease Clue Enhanced Large Language Model, Yuhao Wang, Chao Hao, Yawen Cui, Xinqi Su, Weicheng Xie, Tao Tan, Zitong Yu [Paper]
[arXiv:2405.14113] Multi-modality Regional Alignment Network for Covid X-Ray Survival Prediction and Report Generation, Zhusi Zhong, Jie Li, John Sollee, Scott Collins, Harrison Bai, Paul Zhang, Terrence Healey, Michael Atalay, Xinbo Gao, Zhicheng Jiao [Paper] [Code]
[arXiv:2408.03500] e-Health CSIRO at RRG24: Entropy-Augmented Self-Critical Sequence Training for Radiology Report Generation, Aaron Nicolson, Jinghui Liu, Jason Dowling, Anthony Nguyen, Bevan Koopman [Paper] [Code]
[ACM MM 2024] In-Context Learning for Zero-shot Medical Report Generation, RUI Liu, Mingjie Li, Shen Zhao, Ling Chen, Xiaojun Chang, Lina Yao [Paper]
[Nature 2023] Singhal, K., Azizi, S., Tu, T. et al. Large language models encode clinical knowledge. Nature 620, 172–180 (2023). https://doi.org/10.1038/s41586-023-06291-2 [Paper]
[Med-PaLM 2] Towards Expert-Level Medical Question Answering with Large Language Models, [Paper]
[Med-PaLM Multimodal (Med-PaLM M)] Towards Generalist Biomedical AI, Tao Tu∗, ‡, 1, Shekoofeh Azizi [Paper]
[MedVersa] A Generalist Learner for Multifaceted Medical Image Interpretation, Hong-Yu Zhou, Subathra Adithan, Julián Nicolás Acosta, Eric J. Topol, Pranav Rajpurkar [Paper]
[arXiv:2403.08002v2] Training Small Multimodal Models to Bridge Biomedical Competency Gap: A Case Study in Radiology Imaging, Juan Manuel Zambrano Chaves, Shih-Cheng Huang, Yanbo Xu, Hanwen Xu, Naoto Usuyama, Sheng Zhang, Fei Wang, Yujia Xie, Mahmoud Khademi, Ziyi Yang, Hany Awadalla, Julia Gong, Houdong Hu, Jianwei Yang, Chunyuan Li, Jianfeng Gao, Yu Gu, Cliff Wong, Mu Wei, Tristan Naumann, Muhao Chen, Matthew P. Lungren, Serena Yeung-Levy, Curtis P. Langlotz, Sheng Wang, Hoifung Poon [Paper]
[arXiv:2403.08002] Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation, Juan Manuel Zambrano Chaves, Shih-Cheng Huang, Yanbo Xu, Hanwen Xu, Naoto Usuyama, Sheng Zhang, Fei Wang, Yujia Xie, Mahmoud Khademi, Ziyi Yang, Hany Awadalla, Julia Gong, Houdong Hu, Jianwei Yang, Chunyuan Li, Jianfeng Gao, Yu Gu, Cliff Wong, Mu Wei, Tristan Naumann, Muhao Chen, Matthew P. Lungren, Akshay Chaudhari, Serena Yeung-Levy, Curtis P. Langlotz, Sheng Wang, Hoifung Poon [Paper] [CheXprompt (Code)]
[CVPR2024] MedM2G: Unifying Medical Multi-Modal Generation via Cross-Guided Diffusion with Visual Invariant, Chenlu Zhan, Yu Lin, Gaoang Wang, Hongwei Wang, Jian Wu [Paper]
Quality Control for Radiology Report Generation Models via Auxiliary Auditing Components, Hermione Warr, Yasin Ibrahim, Daniel R. McGowan, Konstantinos Kamnitsas [Paper]
Zhao B N, JIANG X, Luo X, et al. Large Multimodal Model for Real-World Radiology Report Generation[J]. [Paper]
A Multimodal Knowledge-enhanced Whole-slide Pathology Foundation Model, Yingxue Xu, Yihui Wang, Fengtao Zhou, Jiabo Ma, Shu Yang, Huangjing Lin, Xin Wang, Jiguang Wang, Li Liang, Anjia Han, Ronald Cheong Kin Chan, Hao Chen [Paper]
[arXiv:2407.15158] HERGen: Elevating Radiology Report Generation with Longitudinal Data, Fuying Wang, Shenghui Du, Lequan Yu, ECCV 2024, [Paper] [Code]
Eye Gaze Guided Cross-Modal Alignment Network for Radiology Report Generation, [Paper]
[ECCV 2024] Contrastive Learning with Counterfactual Explanations for Radiology Report Generation, [Paper] [Code]
[IEEE TMI 2024] Multi-Grained Radiology Report Generation With Sentence-Level Image-Language Contrastive Learning, [Paper]
[IEEE TMI 2024] PhraseAug: An Augmented Medical Report Generation Model with Phrasebook, [Paper]
[IEEE TMM 2023] Semi-Supervised Medical Report Generation via Graph-Guided Hybrid Feature Consistency, [Paper]
[IEEE TMI 2024] SGT++: Improved Scene Graph-Guided Transformer for Surgical Report Generation, [Paper]
[IEEE TNNLS] Hybrid Reinforced Medical Report Generation With M-Linear Attention and Repetition Penalty, [Paper]
[CIKM '23] Li, Qi. "Harnessing the power of pre-trained vision-language models for efficient medical report generation." Proceedings of the 32nd ACM International Conference on Information and Knowledge Management. 2023.
[IEEE TMI 2023] Attributed Abnormality Graph Embedding for Clinically Accurate X-Ray Report Generation, [Paper]
[IEEE TMI 2024] ChatCAD+: Towards a Universal and Reliable Interactive CAD using LLMs, [Paper] [Code]
[IEEE TMI 2023] Attributed Abnormality Graph Embedding for Clinically Accurate X-Ray Report Generation, [Paper]
[IEEE TMM 2023] Multi-Task Paired Masking With Alignment Modeling for Medical Vision-Language Pre-Training [Paper]
[IEEE TMI 2024] Token-Mixer: Bind Image and Text in One Embedding Space for Medical Image Reporting [Paper] [Code]
[arXiv:2405.04175] Topic-wise Separable Sentence Retrieval for Medical Report Generation, Junting Zhao, Yang Zhou, Zhihao Chen, Huazhu Fu, Liang Wan [Paper]
[WACV 2024] CXR-IRGen: An Integrated Vision and Language Model for the Generation of Clinically Accurate Chest X-Ray Image-Report Pairs, Junjie Shentu, Noura Al Moubayed, [Paper] [Code]
[CVPR-2024] Instance-level Expert Knowledge and Aggregate Discriminative Attention for Radiology Report Generation, Shenshen Bu, Taiji Li, Yuedong Yang,*Zhiming Dai [Paper] [Code]
[arXiv:2406.04449] MAIRA-2: Grounded Radiology Report Generation, Shruthi Bannur, Kenza Bouzid, Daniel C. Castro, Anton Schwaighofer, Sam Bond-Taylor, Maximilian Ilse, Fernando Pérez-García, Valentina Salvatelli, Harshita Sharma, Felix Meissen, Mercy Ranjit, Shaury Srivastav, Julia Gong, Fabian Falck, Ozan Oktay, Anja Thieme, Matthew P. Lungren, Maria Teodora Wetscherek, Javier Alvarez-Valle, Stephanie L. Hyland [Paper]
[MICCAI 2024] Textual Inversion and Self-supervised Refinement for Radiology Report Generation, Yuanjiang Luo, Hongxiang Li, Xuan Wu, Meng Cao, Xiaoshuang Huang, Zhihong Zhu, Peixi Liao, Hu Chen, Yi Zhang [Paper]
[arXiv:2405.19654] Unlocking the Power of Spatial and Temporal Information in Medical Multimodal Pre-training, Jinxia Yang, Bing Su, Wayne Xin Zhao, Ji-Rong Wen [Paper] [Code]
[arXiv:2405.14113] Multi-modality Regional Alignment Network for Covid X-Ray Survival Prediction and Report Generation, Zhusi Zhong, Jie Li, John Sollee, Scott Collins, Harrison Bai, Paul Zhang, Terrence Healey, Michael Atalay, Xinbo Gao, Zhicheng Jiao [Paper]
FITA: Fine-grained Image-Text Aligner for Radiology Report Generation, Honglong Yang, Hui Tang, Xiaomeng Li [Paper]
A Disease Labeler for Chinese Chest X-Ray Report Generation, arXiv:2404.16852, Mengwei Wang, Ruixin Yan, Zeyi Hou, Ning Lang, Xiuzhuang Zhou [Paper]
"Bootstrapping Large Language Models for Radiology Report Generation." Liu, Chang, et al. Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 38. No. 17. 2024. [Paper] [Code]
[ICME 2024] Prompt-Guided Generation of Structured Chest X-Ray Report Using a Pre-trained LLM, arXiv:2404.11209, Hongzhao Li, Hongyu Wang, Xia Sun, Hua He, Jun Feng [Paper]
[CVPR2024] MedM2G: Unifying Medical Multi-Modal Generation via Cross-Guided Diffusion with Visual Invariant, Chenlu Zhan, Yu Lin, Gaoang Wang, Hongwei Wang, Jian Wu [Paper]
[AAAI-2024] PromptMRG: Diagnosis-Driven Prompts for Medical Report Generation, Haibo Jin1 , Haoxuan Che1, Yi Lin1, and Hao Chen [Paper] [Code]
[AAAI-2024] MedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models, Yan Cai; Linlin Wang; Ye Wang; Gerard de Melo; Ya Zhang; Yan-Feng Wang; Liang He [Paper]
[CVPR2024] AHIVE: Anatomy-aware Hierarchical Vision Encoding for Interactive Radiology Report Retrieval, Sixing Yan, William K. Cheung, Ivor W. Tsang, Keith Chiu, Terence M. Tong, Ka Chun Cheung, Simon See [Paper]
[CVPR2024] **InVERGe: Intelligent Visual Encoder for Bridging Modalities in Report Generation (Workshop) **, Ankan Deria, Komal Kumar, Snehashis Chakraborty, Dwarikanath Mahapatra, Sudipta Roy [Paper]

[Code]
[ACL-2024] DocLens: Multi-aspect Fine-grained Evaluation for Medical Text Generation, Yiqing Xie, Sheng Zhang, Hao Cheng, Pengfei Liu, Zelalem Gero, Cliff Wong, Tristan Naumann, Hoifung Poon, Carolyn Rose [paper][code]

[code]
[ACL-2024] SICAR at RRG2024: GPU Poor’s Guide to Radiology Report Generation, Kiartnarin Udomlapsakul, Parinthapat Pengpun, Tossaporn Saengja, Kanyakorn Veerakanjana, Krittamate Tiankanon, Pitikorn Khlaisamniang, Pasit Supholkhan, Amrest Chinkamol, Pubordee Aussavavirojekul, Hirunkul Phimsiri, Tara Sripo, Chiraphat Boonnag, Trongtum Tongdee,Thanongchai Siriapisith, Pairash Saiviroonporn, Jiramet Kinchagawat, Piyalitt Ittichaiwong

[paper]
[ACL-2024] BiCAL: Bi-directional Contrastive Active Learning for Clinical Report Generation, Tianyi Wu, Jingqing Zhang, Wenjia Bai, Kai Sun

[paper]
[ACL-2024] CID at RRG24: Attempting in a Conditionally Initiated Decoding of Radiology Report Generation with Clinical Entities, Yuxiang Liao*, Yuanbang Liang*, Yipeng Qin, Hantao Liu, Irena Spasi´ c

[paper]
[ACL-2024] **RadGraph-XL: A Large-Scale Expert-Annotated Dataset for Entity and Relation Extraction from Radiology Reports **, Jean-Benoit Delbrouck, Pierre Chambon, Zhihong Chen, Maya Varma, Andrew Johnston, Louis Blankemeier, Dave Van Veen, Tan Bui, Steven Truong, Curtis Langlotz [paper]

[code]
[ACL-2024] **MLeVLM: Improve Multi-level Progressive Capabilities based on Multimodal Large Language Model for Medical Visual Question Answering **,Dexuan Xu, Yanyuan Chen, Jieyi Wang, Yue Huang, Hanpin Wang, Zhi Jin, Hongxing Wang, Weihua Yue, Jing He, Hang Li, Yu Huang [paper]

[code]
[ACL-2024] **Fine-Grained Image-Text Alignment in Medical Imaging Enables Explainable Cyclic Image-Report Generation **,Wenting Chen, Linlin Shen, Jingyang Lin, Jiebo Luo, Xiang Li, Yixuan Yuan [paper]
[ICLR-2024] **LLM-CXR: Instruction-Finetuned LLM for CXR Image Understanding and Generation **,Suhyeon Lee, Won Jun Kim, Jinho Chang, Jong Chul Ye [paper]

[code]
[ACM MM-2024] **Medical Report Generation via Multimodal Spatio-Temporal Fusion **,Xin Mei, Rui Mao, Xiaoyan Cai, Libin Yang, Erik Cambria [paper]
[ACM MM-2024] **Diffusion Networks with Task-Specific Noise Control for Radiology Report Generation **,Yuanhe Tian, Fei Xia, Yan Song [paper]
[ACM MM-2024] **Divide and Conquer: Isolating Normal-Abnormal Attributes in Knowledge Graph-Enhanced Radiology Report Generation **,Xiao Liang, Yanlei Zhang, Di Wang, Haodi Zhong, Ronghan Li, Quan Wang [paper]
[ICLR-2024] ICON: Improving Inter-Report Consistency of Radiology Report Generation via Lesion-aware Mix-up Augmentation,Wenjun Hou, Yi Cheng, Kaishuai Xu, Yan Hu, Wenjie Li, Jiang Liu [paper]

[code]
[ICLR-2024] Divide and Conquer Radiology Report Generation via Observation Level Fine-grained Pretraining and Prompt Tuning,Yuanpin Zhou, Huogen Wang [paper]
[MICCAI-2024] CT2Rep: Automated Radiology Report Generation for 3D Medical Imaging,Ibrahim Ethem Hamamci, Sezgin Er, Bjoern Menze [paper]

[code]
[MICCAI-2024] WsiCaption: Multiple Instance Generation of Pathology Reports for Gigapixel Whole Slide Images,Pingyi Chen, Honglin Li, Chenglu Zhu, Sunyi Zheng, Zhongyi Shui, Lin Yang [paper]

[code]
[MICCAI-2024] Multivariate Cooperative Game for Image-Report Pairs: Hierarchical Semantic Alignment for Medical Report Generation,Zhihong Zhu, Xuxin Cheng, Yunyan Zhang, Zhaorun Chen, Qingqing Long, Hongxiang Li, Zhiqi Huang, Xian Wu & Yefeng Zheng [paper]
[MICCAI-2024] MRScore: Evaluating Medical Report with LLM-Based Reward System,Yunyi Liu, Zhanyu Wang, Yingshu Li, Xinyu Liang, Lingqiao Liu, Lei Wang, Luping Zhou [paper]
[MICCAI-2024] **Energy-Based Controllable Radiology Report Generation with Medical Knowledge **,Zeyi Hou, Ruixin Yan, Ziye Yan, Ning Lang & Xiuzhuang Zhou [paper]
[MICCAI-2024] GMoD: Graph-driven Momentum Distillation Framework with Active Perception of Disease Severity for Radiology Report Generation,ZhiPeng Xiang, ShaoGuo Cui, CaoZhi Shang, Jingfeng Jiang & Liqiang Zhang [paper]

[code]
[MICCAI-2024] TiBiX: Leveraging Temporal Information for Bidirectional X-ray and Report Generation (MICCAI Workshop),Santosh Sanjeev, Fadillah Adamsyah Maani, Arsen Abzhanov, Vijay Ram Papineni, Ibrahim Almakky, Bartłomiej W. Papież, Mohammad Yaqub [paper]

[code]
[CIKM-2024] CLR2G: Cross-modal Contrastive Learning on Radiology Report,Mohammadreza Zolfaghari, Yi Zhu, Peter Gehler, Thomas Brox [paper]
[WACV-2024] Complex Organ Mask Guided Radiology Report Generation,Tiancheng Gu, Dongnan Liu, Zhiyuan Li, Weidong Cai [paper]

[code]
[ACCV-2024] FG-CXR: A Radiologist-Aligned Gaze Dataset for Enhancing Interpretability in Chest X-Ray Report Generation,Trong Thang Pham,Ngoc-VuongHo,Nhat-TanBui, Thinh Phan, Patel Brijesh,DonaldAdjeroh,GianfrancoDoretto,AnhNguyen, Carol C. W5,HienNguyen,andNganLe

[paper]
[MedIA-2024] From Vision to Text: A Comprehensive Review of Natural Image Captioning in Medical Diagnosis and Radiology Report Generation,Gabriel Reale-Nosei, Elvira Amador-Domínguez , Emilio Serrano

[paper]
[MedIA-2024] Enhancing the vision–language foundation model with key semantic knowledge-emphasized report refinement,Weijian Huang, Cheng Li, Hao Yang, Jiarun Liu, Yong Liang, Hairong Zheng, Shanshan Wang

[paper]
[MedIA-2024] DACG: Dual Attention and Context Guidance Model for Radiology Report Generation,Wangyu Lang, Zhi Liu, Yijia Zhang

[paper]

[code]
[TMI-2024] An Organ-aware Diagnosis Framework for Radiology Report Generation,Shiyu Li, Pengchong Qiao, Lin Wang, Munan Ning, Li Yuan, Yefeng Zheng, Jie Chen

[paper]
[TMI-2024] Attribute Prototype-guided Iterative Scene Graph for Explainable Radiology Report Generation,Ke Zhang, Yan Yang, Jun Yu, Jianping Fan, Hanliang Jiang, Qingming Huang, Weidong Han

[paper]
[TMI-2024] A New Benchmark: Clinical Uncertainty and Severity Aware Labeled Chest X-Ray Images with Multi-Relationship Graph Learning,Mengliang Zhang, Xinyue Hu, Lin Gu, Liangchen Liu, Kazuma Kobayashi, Tatsuya Harada, Yan Yan, Ronald M Summers, Yingying Zhu

[paper]
[TMM-2024] Multi-Level Objective Alignment Transformer for Fine-Grained Oral Panoramic X-Ray Report GenerationNan Gao; Renyuan Yao, Ronghua Liang, Peng Chen; Tianshuang Liu, Yuanjie Dang

[paper]
[JBHI-2024] CAMANet: Class Activation Map Guided Attention Network for Radiology Report Generation,Jun Wang, Abhir Bhalerao, Terry Yin, Simon See, , and Yulan He

[paper]

[code]
[JBHI-2024] TSGET: Two-Stage Global Enhanced Transformer for Automatic Radiology Report Generation,Xiulong Yi, You Fu, Ruiqing Liu, Hao Zhang, Rong Hua

[paper]

[code]
[Expert Systems with Applications-2024] CheXReport: A transformer-based architecture to generate chest X-ray reports suggestions,Felipe André Zeiser, Cristiano André da Costa, Gabriel de Oliveira Ramos, Andreas Maier, Rodrigo da Rosa Righi

[paper]

[code]
[Knowledge-Based Systems-2024] Automatic medical report generation combining contrastive learning and feature difference,Chongwen Lyu, Chengjian Qiu, Kai Han, Saisai Li, Victor S. Sheng, Huan Rong , Yuqing Song, Yi Liu a, Zhe Liu

[paper]
[Neurocomputing-2024] Improving radiology report generation with multi-grained abnormality prediction,Yuda Jin, Weidong Chen, Yuanhe Tian, Yan Song, Chenggang Yan

[paper]
[Neurocomputing-2024] An open chest X-ray dataset with benchmarks for automatic radiology report generation in French,Hichem Metmer, Xiaoshan Yang

[paper]
[Neurocomputing-2024] Trust it or not: Confidence-guided automatic radiology report generation,Yixin Wang , Zihao Lin, Zhe Xu, Haoyu Dong, Jie Luo, Jiang Tian, Zhongchao Shi, Lifu Huang, Yang Zhang, Jianping Fan, Zhiqiang He

[paper]
[Neurocomputing-2024] VG-CALF: A vision-guided cross-attention and late-fusion network for radiology images in medical visual question answering,Aiman Lameesa, Chaklam Silpasuwanchai, Md. Sakib Bin Alam

[paper]
[Academic Radiology-2024] Practical Evaluation of ChatGPT Performance for Radiology Report Generation,Mohsen Soleimani, Navisa Seyyedi, Seyed Mohammad Ayyoubzadeh, Sharareh Rostam Niakan Kalhori, Hamidreza Keshavarz

[paper]
[Radiology-2024] Constructing a Large Language Model to Generate Impressions from Findings in Radiology Reports,Lu Zhang*, Mingqian Liu*, Lingyun Wang, Yaping Zhang, Xiangjun Xu, Zhijun Pan, Yan Feng, Jue Zhao, Lin Zhang, Gehong Yao, Xu Chen, Xueqian Xie

[paper]
[Radiology-2024] Comparing Commercial and Open-Source Large Language Models for Labeling Chest Radiograph Reports,Felix J. Dorfner , Liv Jürgensen, Leonhard Donle, Fares Al Mohamad, Tobias R. Bodenmann, Mason C. Cleveland, Felix Busch, Lisa C. Adams, James Sato, Thomas Schultz, Albert E. Kim, Jameson Merkow, Keno K. Bressem, Christopher P. Bridge

[paper]
[IEEE Transactions on Emerging Topics in Computational Intelligence-2024] End-to-End Clustering Enhanced Contrastive Learning for Radiology Reports Generation,Xinyao Liu, Junchang Xin, Qi Shen, Chuangang Li, Zhihong Huang, Zhiqiong Wang

[paper]
[arXiv-2024] Factual Serialization Enhancement: A Key Innovation for Chest X-ray Report Generation,Kang Liu, Zhuoqi Ma, Mengmeng Liu, Zhicheng Jiao, Xiaolu Kang, Qiguang Miao, Kun Xie

[paper]

[code]
[arXiv-2024] GREEN: Generative Radiology Report Evaluation and Error Notation,Sophie Ostmeier, Justin Xu, Zhihong Chen, Maya Varma, Louis Blankemeier, Christian Bluethgen, Arne Edward Michalson, Michael Moseley, Curtis Langlotz, Akshay S Chaudhari, Jean-Benoit Delbrouck

[paper]
[arXiv-2024] CheXpert Plus: Hundreds of Thousands of Aligned Radiology Texts, Images and Patients,Pierre Chambon, Jean-Benoit Delbrouck, Thomas Sounack, Shih-Cheng Huang

[paper]

[code]
[arXiv-2024] Dia-LLaMA: Towards Large Language Model-driven CT Report Generation,Zhixuan Chen, Luyang Luo, Yequan Bie, Hao Chen

[paper]
[arXiv-2024] Benchmarking and Boosting Radiology Report Generation for 3D High-Resolution Medical Images,Che Liu, Zhongwei Wan, Yuqi Wang, Hui Shen, Haozhe Wang, Kangyu Zheng, Mi Zhang, Rossella Arcucci

[paper]
[arXiv-2024] The Impact of Auxiliary Patient Data on Automated Chest X-Ray Report Generation and How to Incorporate It,Aaron Nicolson, Shengyao Zhuang, Jason Dowling, Bevan Koopman

[paper]

[code]
[arXiv-2024] Improving Expert Radiology Report Summarization by Prompting Large Language Models with a Layperson Summary,Xingmeng Zhao, Tongnian Wang, Anthony Rios

[paper]
[arXiv-2024] X-ray Made Simple: Radiology Report Generation and Evaluation with Layman's Terms,Kun Zhao, Chenghao Xiao, Chen Tang, Bohao Yang, Kai Ye, Noura Al Moubayed, Liang Zhan, Chenghua Lin

[paper]
[arXiv-2024] Multi-modal vision-language model for generalizable annotation-free pathology localization and clinical diagnosis,Hao Yang, Hong-Yu Zhou, Zhihuan Li, Yuanxu Gao, Cheng Li, Weijian Huang, Jiarun Liu, Hairong Zheng, Kang Zhang, Shanshan Wang

[paper]

[code]
[arXiv-2024] R2GenCSR: Retrieving Context Samples for Large Language Model based X-ray Medical Report Generation,Xiao Wang, Yuehang Li, Fuling Wang, Shiao Wang, Chuanfu Li, Bo Jiang

[paper]

[code]
[arXiv-2024] Direct Preference Optimization for Suppressing Hallucinated Prior Exams in Radiology Report Generation,Oishi Banerjee, Hong-Yu Zhou, Subathra Adithan, Stephen Kwak, Kay Wu, Pranav Rajpurkar

[paper]
[arXiv-2024] M4CXR: Exploring Multi-task Potentials of Multi-modal Large Language Models for Chest X-ray Interpretation,Jonggwon Park, Soobum Kim, Byungmu Yoon, Jihun Hyun, Kyoyun Choi

[paper]
[arXiv-2024] Democratizing MLLMs in Healthcare: TinyLLaVA-Med for Efficient Healthcare Diagnostics in Resource-Constrained Settings,Aya El Mir, Lukelo Thadei Luoga, Boyuan Chen, Muhammad Abdullah Hanif, Muhammad Shafique

[paper]
[arXiv-2024] Expert-level vision-language foundation model for real-world radiology and comprehensive evaluation,Xiaohong Liu, Guoxing Yang, Yulin Luo, Jiaji Mao, Xiang Zhang, Ming Gao, Shanghang Zhang, Jun Shen, Guangyu Wang

[paper]
[arXiv-2024] 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models,Hao Chen, Wei Zhao, Yingli Li, Tianyang Zhong, Yisong Wang, Youlan Shang, Lei Guo, Junwei Han, Tianming Liu, Jun Liu, Tuo Zhang

[paper]
[arXiv-2024] Image-aware Evaluation of Generated Medical Reports,Gefen Dawidowicz, Elad Hirsch, Ayellet Tal

[paper]
[arXiv-2024] Text-Enhanced Medical Visual Question Answering, Chih-Ying Liu , Fan Diao

[paper]
[arXiv-2024] MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models,Peng Xia, Kangyu Zhu, Haoran Li, Tianze Wang, Weijia Shi, Sheng Wang, Linjun Zhang, James Zou, Huaxiu Yao

[paper]

[code]
[arXiv-2024] **R2GEN-MAMBA:ASELECTIVESTATESPACEMODELFORRADIOLOGYREPORT GENERATION **, Yongheng Sun, Yueh Z. Lee, Genevieve A. Woodard, Hongtu Zhu, Chunfeng Lian,,Mingxia Liu

[paper]

[code]
[arXiv-2024] Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs, Xiaoman Zhang, Julián N. Acosta, Hong-Yu Zhou, Pranav Rajpurkar

[paper]

[code]
[arXiv-2024] Diff-CXR: Report-to-CXR generation through a disease-knowledge enhanced diffusion model, Peng Huang, Bowen Guo, Shuyu Liang, Junhu Fu, Yuanyuan Wang, Yi Guo

[paper]
[arXiv-2024] FINE-GRAINED VERIFIERS: PREFERENCE MODELING AS NEXT-TOKEN PREDICTION IN VISION-LANGUAGE ALIGNMENT, Chenhang Cui, An Zhang, Yiyang Zhou, Zhaorun Chen, Gelei Deng, Huaxiu Yao, Tat-Seng Chua

[paper]

Year 2023

Li M, Lin B, Chen Z, et al. Dynamic graph enhanced contrastive learning for chest x-ray report generation[C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2023: 3334-3343. [Paper] [Code]
Yang, Shuxin, et al. "Radiology report generation with a learned knowledge base and multi-modal alignment." Medical Image Analysis 86 (2023): 102798. [Paper] [Code]
[MICCAI workshop 2023] Xiong, Yiheng, et al. "Prior-RadGraphFormer: A Prior-Knowledge-Enhanced Transformer for Generating Radiology Graphs from X-Rays." International Conference on Medical Image Computing and Computer-Assisted Intervention. Cham: Springer Nature, Switzerland, 2023. [Paper] [Code]
[arXiv:2312.03970] Improving Medical Report Generation with Adapter Tuning and Knowledge Enhancement in Vision-Language Foundation Models, Shibin Wu, Bang Yang, Zhiyu Ye, Haoqian Wang, Hairong Zheng, Tong Zhang [Paper]
[arXiv:2303.09117] Cross-Modal Causal Intervention for Medical Report Generation, Weixing Chen, Yang Liu, Ce Wang, Jiarui Zhu, Shen Zhao, Guanbin Li, Cheng-Lin Liu, Liang Lin [Paper] [Code]
[arXiv:2307.12526] Rethinking Medical Report Generation: Disease Revealing Enhancement with Knowledge Graph, Yixin Wang, Zihao Lin, Haoyu Dong [Paper]
[arXiv:2307.09758] Longitudinal Data and a Semantic Similarity Reward for Chest X-Ray Report Generation, Aaron Nicolson, Jason Dowling, Bevan Koopman [Paper] [Code]
"Improving chest X-ray report generation by leveraging warm starting." Nicolson, Aaron, Jason Dowling, and Bevan Koopman. Artificial intelligence in medicine 144 (2023): 102633. [Paper] [Code]
[arXiv:2310.05881, EMNLP 2023] Controllable Chest X-Ray Report Generation from Longitudinal Representations, Francesco Dalla Serra, Chaoyang Wang, Fani Deligianni, Jeffrey Dalton, Alison Q O'Neil [Paper]
RaDialog: A Large Vision-Language Model for Radiology Report Generation and Conversational Assistance, Chantal Pellegrini, Ege Özsoy, Benjamin Busam, Nassir Navab, Matthias Keicher [Paper] [Code]
Visual-linguistic causal intervention for radiology report generation. Chen, W., Liu, Y., Wang, C., Li, G., Zhu, J., & Lin, L. (2023). arXiv preprint arXiv:2303.09117. [Paper] [Code]
Zhang, Ke, et al. "Semi-supervised Medical Report Generation via Graph-guided Hybrid Feature Consistency." IEEE Transactions on Multimedia (2023). [Paper]
[ACL-2023] ORGAN: Observation-Guided Radiology Report Generation via Tree Reasoning, Wenjun Hou, Kaishuai Xu, Yi Cheng, Wenjie Li, Jiang Liu [Paper] [Code]
[EMNLP-2023] Hou, Wenjun, et al. "RECAP: Towards Precise Radiology Report Generation via Dynamic Disease Progression Reasoning." Findings of the Association for Computational Linguistics: EMNLP 2023. 2023. [Paper] [Code]

Year 2022

Uncertainty-aware report generation for chest X-rays by variational topic inference, [Paper]
Improving Radiology Report Generation Systems by Removing Hallucinated References to Non-existent Priors, Machine Learning for Health (ML4H) 2022 [Paper]
Yang, Shuxin, et al. "Knowledge matters: Chest radiology report generation with general and specific knowledge." Medical image analysis 80 (2022): 102510. [Paper] [Code]
[ECCV-2022] Cross-modal prototype driven network for radiology report generation. In European Conference on Computer Vision (pp. 563-579). Wang, J., Bhalerao, A., & He, Y. (2022, October). Cham: Springer Nature Switzerland. [Paper] [Code]
Najdenkoska I, Zhen X, Worring M, et al. Uncertainty-aware report generation for chest X-rays by variational topic inference[J]. Medical Image Analysis, 2022, 82: 102603. [Paper]

Year 2021 and Before

Endo M, Krishnan R, Krishna V, et al. Retrieval-based chest x-ray report generation using a pre-trained contrastive language-image model[C]//Machine Learning for Health. PMLR, 2021: 209-219. [Paper] [Code]
"Cross-modal Memory Networks for Radiology Report Generation." Chen, Zhihong, et al. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). 2021. [Paper] [R2GenCMN-Code]
On the Automatic Generation of Medical Imaging Reports, Baoyu Jing, Pengtao Xie, Eric Xing [Paper] [Code]
[AAAI 2019] CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison, Jeremy Irvin, Pranav Rajpurkar, Michael Ko, Yifan Yu, Silviana Ciurea-Ilcus, Chris Chute, Henrik Marklund, Behzad Haghgoo, Robyn Ball, Katie Shpanskaya, Jayne Seekins, David A. Mong, Safwan S. Halabi, Jesse K. Sandberg, Ricky Jones, David B. Larson, Curtis P. Langlotz, Bhavik N. Patel, Matthew P. Lungren, Andrew Y. Ng [Paper] [Code] [chexpert-labeler]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

medical_report_generation.md

medical_report_generation.md

Surveys & Thesis

Big Project

Year 2024

Year 2023

Year 2022

Year 2021 and Before

Files

medical_report_generation.md

Latest commit

History

medical_report_generation.md

File metadata and controls

Surveys & Thesis

Big Project

Year 2024

Year 2023

Year 2022

Year 2021 and Before