ielab member

Shengyao Zhuang

Alumni

PhD student (2019 - 2023), UQ, BERT and Large Language Model-based Rankers and Online Learning to Rank,

Projects

Information Access Systems for Clinicians Federated Online Learning to Rank Online Learning to Rank Safe and Reliable Generative IR Scalable Generative IR Transformers for Information Retrieval

Publications (70)

As listed on Google Scholar (since 2019) · metadata via OpenAlex · updated 2026-07-12 Google Scholar OpenAlex

2026

9 publications

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents
Zijian Chen, Xueguang Ma, Shengyao Zhuang, Jimmy Lin, Akari Asai, Victor Zhong

arXiv (Cornell University) · 2026

PDF
DiffRetriever: Parallel Representative Tokens for Retrieval with Diffusion Language Models
Shuai Wang, Yin Yu, Shengyao Zhuang, Bevan Koopman, Guido Zuccon

arXiv (Cornell University) · 2026

PDF
Do We Still Need Text Features for Video Retrieval in the Era of Vision-Language Models?
JS Zhan, C Zhang, S Zhuang, X Ma, J Lin

European Conference on Information Retrieval, 380-387 · 2026
Improving Long-Context Retrieval with Multi-Prefix Embedding
Zhenglin Yu, Xueguang Ma, Shengyao Zhuang, Zhewei Xu, Luyu Gao, Crystina Zhang, Jimmy Lin

arXiv (Cornell University) · 2026

PDF
LACONIC: Dense-Level Effectiveness for Scalable Sparse Retrieval via a Two-Phase Training Curriculum
Zhichao Xu, Shengyao Zhuang, Xinyu Zhang, Xueguang Ma, Yijun Tian, Maitrey Mehta, Jimmy Lin, Vivek Srikumar

2026

PDF
Layer-wise Token Compression for Efficient Document Reranking
Shengyao Zhuang, zhichao Xu, Ivano Lauriola

arXiv (Cornell University) · 2026

PDF
Rank-R1: Enhancing Reasoning in LLM-based Document Rerankers via Reinforcement Learning
Shengyao Zhuang, Xueguang Ma, Zheng Yao, Shuai Wang, Bevan Koopman, Jimmy Lin, Guido Zuccon

2026
Starbucks: Improved Training for 2D Matryoshka Embeddings
Shengyao Zhuang, Shuai Wang, Fabio Zheng, Bevan Koopman, Guido Zuccon

Lecture notes in computer science · 2026
Where Relevance Emerges: A Layer-Wise Study of Internal Attention for Zero-Shot Re-Ranking
Hongyu Chen, Shengyao Zhuang, Zheng Yao, Guido Zuccon, Teerapong Leelanupab

Open MIND · 2026

2025

19 publications

Report from the 4th Strategic Workshop on Information Retrieval in Lorne (SWIRL 2025)
JR Trippas, JS Culpepper, M Aliannejadi, J Allan, E Amigó, J Arguello, ...

ACM SIGIR Forum 59 (1), 1-68 · 2025
An Investigation of Prompt Variations for Zero-Shot LLM-Based Rankers
Shuoqi Sun, Shengyao Zhuang, Shuai Wang, Guido Zuccon

Lecture notes in computer science · 2025
Rank-DistiLLM: Closing the Effectiveness Gap Between Cross-Encoders and LLMs for Passage Re-ranking
Ferdinand Schlatt, Maik Fröbe, Harrisen Scells, Shengyao Zhuang, Bevan Koopman, Guido Zuccon, Benno Stein, Martin Potthast, Matthias Hagen

Lecture notes in computer science · 2025
Corpus Subsampling: Estimating the Effectiveness of Neural Retrieval Models on Large Corpora
Maik Fröbe, Andrew Parry, Harrisen Scells, Shuai Wang, Shengyao Zhuang, Guido Zuccon, Martin Potthast, Matthias Hagen

Lecture notes in computer science · 2025
LLM-VPRF: Large Language Model Based Vector Pseudo Relevance Feedback
H Li, S Zhuang, B Koopman, G Zuccon

arXiv preprint arXiv:2504.01448 · 2025
VISA: Retrieval Augmented Generation with Visual Source Attribution
Xueguang Ma, Shengyao Zhuang, Bevan Koopman, Guido Zuccon, Wenhu Chen, Jimmy Lin

2025

PDF
Set-Encoder: Permutation-Invariant Inter-passage Attention for Listwise Passage Re-ranking with Cross-Encoders
Ferdinand Schlatt, Maik Fröbe, Harrisen Scells, Shengyao Zhuang, Bevan Koopman, Guido Zuccon, Benno Stein, Martin Potthast, Matthias Hagen

Lecture notes in computer science · 2025
R ² LLMs: Retrieval and Ranking with LLMs
Guido Zuccon, Shengyao Zhuang, Xueguang Ma

2025

PDF
Tevatron 2.0: Unified Document Retrieval Toolkit across Scale, Language, and Modality
Xueguang Ma, Luyu Gao, Shengyao Zhuang, Jiaqi Samantha Zhan, Jamie Callan, Jimmy Lin

2025

PDF
2D Matryoshka Training for Information Retrieval
Shuai Wang, Shengyao Zhuang, Bevan Koopman, Guido Zuccon

2025

PDF
Distillation versus Contrastive Learning: How to Train Your Rerankers
Zhichao Xu, Zhiqi Huang, Shengyao Zhuang, Vivek Srikumar

2025

PDF
Document Screenshot Retrievers are Vulnerable to Pixel Poisoning Attacks
Shengyao Zhuang, Ekaterina Khramtsova, Xueguang Ma, Bevan Koopman, Jimmy Lin, Guido Zuccon

2025

PDF
ReSLLM: Large Language Models are Strong Resource Selectors for Federated Search
Shuai Wang, Shengyao Zhuang, Bevan Koopman, Guido Zuccon

2025

PDF
BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent
Zijian Chen, Xueguang Ma, Shengyao Zhuang, Ping Nie, Kai Zou, Andy Liu, Joshua Green, Patel, Kshama, Meng, Ruoxi, Ming Su, Sahel Sharifymoghaddam, Yanxi Li et al.

arXiv (Cornell University) · 2025

PDF
Leveraging Reference Documents for Zero-Shot Ranking via Large Language Models
Jieran Li, Xiuyuan Hu, Zhao Yang, Shengyao Zhuang, Hao Zhang

arXiv (Cornell University) · 2025

PDF
MAGMaR Shared Task System Description: Video Retrieval with OmniEmbed
Jiaqi Samantha Zhan, Crystina Zhang, Shengyao Zhuang, Xueguang Ma, Jimmy Lin

arXiv (Cornell University) · 2025

PDF
Rethinking On-policy Optimization for Query Augmentation
Zhichao Xu, Shengyao Zhuang, Xueguang Ma, Chen, Bingsen, Yijun Tian, Fengran Mo, Jie Cao, Vivek Srikumar, Vivek Srikumar

arXiv (Cornell University) · 2025

PDF
SIGIR-AP 2025 Tutorial on Retrieval and Ranking with LLMs (R2LLMs)
G Zuccon, S Zhuang, X Ma, B Koopman

Proceedings of the 2025 Annual International ACM SIGIR Conference on · 2025
The Impact of Auxiliary Patient Data on Automated Chest X-Ray Report Generation and How to Incorporate It
Aaron Nicolson, Shengyao Zhuang, Jason Dowling, Bevan Koopman

2025

PDF

2024

12 publications

A Setwise Approach for Effective and Highly Efficient Zero-shot Ranking with Large Language Models
Shengyao Zhuang, Honglei Zhuang, Bevan Koopman, Guido Zuccon

2024
PromptReps: Prompting Large Language Models to Generate Dense and Sparse Representations for Zero-Shot Document Retrieval
Shengyao Zhuang, Xueguang Ma, Bevan Koopman, Jimmy Lin, Guido Zuccon

2024

PDF
FeB4RAG: Evaluating Federated Search in the Context of Retrieval Augmented Generation
Shuai Wang, Ekaterina Khramtsova, Shengyao Zhuang, Guido Zuccon

2024
Leveraging LLMs for Unsupervised Dense Retriever Ranking
Ekaterina Khramtsova, Shengyao Zhuang, Mahsa Baktashmotlagh, Guido Zuccon

2024

PDF
Zero-Shot Generative Large Language Models for Systematic Review Screening Automation
Shuai Wang, Harrisen Scells, Shengyao Zhuang, Martin Potthast, Bevan Koopman, Guido Zuccon

Lecture notes in computer science · 2024
Large Language Models Based Stemming for Information Retrieval: Promises, Pitfalls and Failures
Shuai Wang, Shengyao Zhuang, Guido Zuccon

2024
Understanding and Mitigating the Threat of Vec2Text to Dense Retrieval Systems
Shengyao Zhuang, Bevan Koopman, Xiaoran Chu, Guido Zuccon

2024

PDF
Dense Retrieval with Continuous Explicit Feedback for Systematic Review Screening Prioritisation
Xinyu Mao, Shengyao Zhuang, Bevan Koopman, Guido Zuccon

2024

PDF
Revisiting Document Expansion and Filtering for Effective First-Stage Retrieval
Watheq Mansour, Shengyao Zhuang, Guido Zuccon, Joel Mackenzie

2024
Team IELAB at TREC Clinical Trial Track 2023: Enhancing Clinical Trial Retrieval with Neural Rankers and Large Language Models
Shengyao Zhuang, Bevan Koopman, Guido Zuccon

arXiv (Cornell University) · 2024

PDF
Does Vec2Text Pose a New Corpus Poisoning Threat?
Shengyao Zhuang, Bevan Koopman, Guido Zuccon

arXiv (Cornell University) · 2024

PDF
Embark on DenseQuest: A System for Selecting the Best Dense Retriever for a Custom Collection
Ekaterina Khramtsova, Teerapong Leelanupab, Shengyao Zhuang, Mahsa Baktashmotlagh, Guido Zuccon

2024

PDF

2023

9 publications

Open-source Large Language Models are Strong Zero-shot Query Likelihood Models for Document Ranking
Shengyao Zhuang, Bing Liu, Bevan Koopman, Guido Zuccon

2023

PDF
Pseudo Relevance Feedback with Deep Language Models and Dense Retrievers: Successes and Pitfalls
Hang Li, Ahmed Mourad, Shengyao Zhuang, Bevan Koopman, Guido Zuccon

ACM Transactions on Information Systems · 2023
Beyond CO2 Emissions: The Overlooked Impact of Water Consumption of Information Retrieval Models
Guido Zuccon, Harrisen Scells, Shengyao Zhuang

2023
AgAsk: an agent to help answer farmer’s questions from scientific documents
Bevan Koopman, Ahmed Mourad, Hang Li, Anton van der Vegt, Shengyao Zhuang, Simon Gibson, Yash P. Dang, D. J. Lawrence, Guido Zuccon

International Journal on Digital Libraries · 2023

PDF
Augmenting Passage Representations with Query Generation for Enhanced Cross-Lingual Dense Retrieval
Shengyao Zhuang, Linjun Shou, Guido Zuccon

2023

PDF
Selecting which Dense Retriever to use for Zero-Shot Search
Ekaterina Khramtsova, Shengyao Zhuang, Mahsa Baktashmotlagh, Xi Wang, Guido Zuccon

2023
Typos-aware Bottlenecked Pre-Training for Robust Dense Retrieval
Shengyao Zhuang, Linjun Shou, Jian Pei, Ming Gong, Houxing Ren, Guido Zuccon, Daxin Jiang

2023
Exploring the Representation Power of SPLADE Models
Joel Mackenzie, Shengyao Zhuang, Guido Zuccon

2023
Teaching pre-trained language models to rank effectively, efficiently, and robustly
Shengyao Zhuang

The University of Queensland · 2023

2022

10 publications

Reduce, reuse, recycle: Green information retrieval research
H Scells, S Zhuang, G Zuccon

Proceedings of the 45th International ACM SIGIR Conference on Research and · 2022
To Interpolate or not to Interpolate: PRF, Dense and Sparse Retrievers
H Li, S Wang, S Zhuang, A Mourad, X Ma, J Lin, G Zuccon

In Proceedings of the 45th International ACM SIGIR Conference on Research · 2022
CharacterBERT and Self-Teaching for Improving the Robustness of Dense Retrievers on Queries with Typos
Shengyao Zhuang, Guido Zuccon

Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval · 2022

PDF
Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation
Shengyao Zhuang, Houxing Ren, Linjun Shou, Jian Pei, Ming Gong, Guido Zuccon, Daxin Jiang

arXiv (Cornell University) · 2022

PDF
Improving Query Representations for Dense Retrieval with Pseudo Relevance Feedback: A Reproducibility Study
Hang Li, Shengyao Zhuang, Ahmed Mourad, Xueguang Ma, Jimmy Lin, Guido Zuccon

Lecture notes in computer science · 2022
Implicit Feedback for Dense Passage Retrieval: A Counterfactual Approach
S Zhuang, H Li, G Zuccon

In Proceedings of the 45th International ACM SIGIR Conference on Research · 2022
Reinforcement online learning to rank with unbiased reward shaping
Shengyao Zhuang, Zhihao Qiao, Guido Zuccon

Information Retrieval · 2022

PDF
Asyncval: A Toolkit for Asynchronously Validating Dense Retriever Checkpoints during Training
Shengyao Zhuang, Guido Zuccon

arXiv (Cornell University) · 2022

PDF
Robustness of Neural Rankers to Typos: A Comparative Study
Shengyao Zhuang, Xinyu Mao, Guido Zuccon

2022
Pseudo-Relevance Feedback with Dense Retrievers in Pyserini
Hang Li, Shengyao Zhuang, Xueguang Ma, Jimmy Lin, Guido Zuccon

2022

2021

9 publications

TILDE: Term Independent Likelihood moDEl for Passage Re-ranking
Shengyao Zhuang, Guido Zuccon

2021
BERT-based Dense Retrievers Require Interpolation with BM25 for Effective Passage Retrieval
Shuai Wang, Shengyao Zhuang, Guido Zuccon

2021
Fast Passage Re-ranking with Contextualized Exact Term Matching and Efficient Passage Expansion
Shengyao Zhuang, Guido Zuccon

arXiv (Cornell University) · 2021

PDF
Dealing with Typos for BERT-based Passage Retrieval and Ranking
Shengyao Zhuang, Guido Zuccon

Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing · 2021

PDF
Deep Query Likelihood Model for Information Retrieval
Shengyao Zhuang, Hang Li, Guido Zuccon

Lecture notes in computer science · 2021
Effective and Privacy-preserving Federated Online Learning to Rank
Shuyi Wang, Bing Liu, Shengyao Zhuang, Guido Zuccon

2021
Federated Online Learning to Rank with Evolution Strategies: A Reproducibility Study
Shuyi Wang, Shengyao Zhuang, Guido Zuccon

Lecture notes in computer science · 2021
How do Online Learning to Rank Methods Adapt to Changes of Intent?
Shengyao Zhuang, Guido Zuccon

2021
IELAB at TREC Deep Learning Track 2021
S Zhuang, H Li, S Wang, G Zuccon

2021

2020

2 publications

Counterfactual Online Learning to Rank
Shengyao Zhuang, Guido Zuccon

Lecture notes in computer science · 2020

PDF
IELAB for TREC Conversational Assistance Track (CAsT) 2020
C Sebastian, H Li, S Zhuang, M Ahmed, K Bevan, Z Guido

2020