Publication | Yunzhi Yao

Energy-Regularized Sequential Model Editing on Hyperspheres.

Qingyuan Liu*, Jia-Chen Gu*, Yunzhi Yao, Hong Wang, Nanyun Peng.

In Proceedings of the 14th International Conference on Learning Representations (ICLR 2026)

PDF Code OpenReview

Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency.

Haoming Xu, Ningyuan Zhao, Yunzhi Yao, Weihong Xu, Hongru Wang, Xinle Deng, Shumin Deng, Jeff Z. Pan, Huajun Chen, Ningyu Zhang.

In Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics (ACL 2026)

PDF Code

ReCode: Updating Code API Knowledge with Reinforcement Learning.

Haoze Wu, Yunzhi Yao, Wenhao Yu, Huajun Chen, Ningyu Zhang.

In Proceedings of the 40th AAAI Conference on Artificial Intelligence (AAAI 2026)

PDF Code

Aligning Agentic World Models via Knowledgeable Experience Learning.

Baochang Ren, Yunzhi Yao, Rui Sun, Shuofei Qiao, Ningyu Zhang, Huajun Chen.

Preprint

PDF Project Code

How Do Large Language Models Learn Concepts During Continual Pre-Training?

Barry Menglong Yao, Sha Li, Yunzhi Yao, Minqian Liu, Zaishuo Xia, Qifan Wang, Lifu Huang.

Preprint

PDF

Rethinking Knowledge Editing in Reasoning Era.

Yunzhi Yao, Jiaxin Qin, Ningyu Zhang, Haoming Xu, Yuqi Zhu, Zeping Yu, Mengru Wang, Yuqi Tang, Jia-Chen Gu, Shumin Deng, Nanyun Peng, Huajun Chen.

PDF

Reflection on Knowledge Editing: Charting the Next Steps.

Yunzhi Yao, Canyu Chen, Jia-Chen Gu, Shumin Deng, Manling Li, Nanyun Peng.

Blog

CaKE: Circuit-aware Editing Enables Generalizable Knowledge Learners.

Yunzhi Yao, Jizhan Fang, Jia-Chen Gu, Ningyu Zhang, Shumin Deng, Huajun Chen, Nanyun Peng.

(EMNLP 2025)

PDF Code

Exploring Model Kinship for Merging Large Language Models.

Yedi Hu, Yunzhi Yao, Ningyu Zhang, Shumin Deng, Huajun Chen.

(EMNLP 2025)

PDF Code

Benchmarking Chinese Knowledge Rectification in Large Language Models.

Jizhan Fang*, Tianhe Lu*, Yunzhi Yao, Xin Xu, Ningyu Zhang, Huajun Chen.

(ACL 2025)

PDF Code

How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training.

Yixin Ou, Yunzhi Yao, Ningyu Zhang, Hui Jin, Jiacheng Sun, Shumin Deng, Zhenguo Li, Huajun Chen.

(ACL 2025)

PDF Code

Knowledge Circuits in Pretrained Transformers.

Yunzhi Yao, Ningyu Zhang, Zekun Xi, Mengru Wang, Ziwen Xu, Shumin Deng, Huajun Chen.

In Proceedings of the 38th Neural Information Processing Systems (NeurIPS 2024)

PDF Code Video

Knowledge mechanisms in large language models: A survey and perspective.

Mengru Wang*, Yunzhi Yao*, Ziwen Xu, Shuofei Qiao, Shumin Deng, Peng Wang, Xiang Chen, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Huajun Chen.

In Findings of the 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP 2024)

PDF

A comprehensive study of knowledge editing for large language models.

Ningyu Zhang*, Yunzhi Yao*, Bozhong Tian*, Peng Wang*, Shumin Deng*, Mengru Wang, Zekun Xi, Shengyu Mao, Jintian Zhang, Yuansheng Ni, Siyuan Cheng, Ziwen Xu, Xin Xu, Jia-Chen Gu, Yong Jiang, Pengjun Xie, Fei Huang, Lei Liang, Zhiqiang Zhang, Xiaowei Zhu, Jun Zhou, Huajun Chen.

PDF Post

Unveiling the pitfalls of knowledge editing for large language models.

Zhoubo Li, Ningyu Zhang, Yunzhi Yao, Mengru Wang, Xi Chen, Huajun Chen.

In Proceedings of the 12th International Conference on Learning Representations (ICLR 2023)

PDF Code

Editing Large Language Models: Problems, Methods, and Opportunities.

Yunzhi Yao*, Peng Wang*, Bozhong Tian, Siyuan Cheng, Zhoubo Li, Shumin Deng, Huajun Chen, Ningyu Zhang.

In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023)

PDF Code Video

Knowledge Rumination for Pre-trained Language Models.

Yunzhi Yao, Peng Wang, Shengyu Mao, Chuanqi Tan, Fei Huang, Huajun Chen, Ningyu Zhang.

In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023)

PDF Code

Schema-aware reference as prompt improves data-efficient knowledge graph construction.

Yunzhi Yao*, Shengyu Mao*, Ningyu Zhang, Xiang Chen, Shumin Deng, Xi Chen, Huajun Chen.

In Proceedings of the 46th International ACM SIGIR Conference (SIGIR 2023)

PDF Code

Kformer: Knowledge injection in transformer feed-forward layers.

Yunzhi Yao, Shaohan Huang, Li Dong, Furu Wei, Huajun Chen, Ningyu Zhang.

In Proceedings of the 11th Natural Language Processing and Chinese Computing (NLPCC 2022)

PDF Code

Adapt-and-distill: Developing small, fast and effective pretrained language models for domains.

Yunzhi Yao, Shaohan Huang, Wenhui Wang, Li Dong, Furu Wei.

In Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021 (ACL 2021)

PDF Code

2026

Energy-Regularized Sequential Model Editing on Hyperspheres.

Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency.

ReCode: Updating Code API Knowledge with Reinforcement Learning.

Aligning Agentic World Models via Knowledgeable Experience Learning.

How Do Large Language Models Learn Concepts During Continual Pre-Training?

2025

Rethinking Knowledge Editing in Reasoning Era.

Reflection on Knowledge Editing: Charting the Next Steps.

CaKE: Circuit-aware Editing Enables Generalizable Knowledge Learners.

Exploring Model Kinship for Merging Large Language Models.

Benchmarking Chinese Knowledge Rectification in Large Language Models.

How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training.

2024

Knowledge Circuits in Pretrained Transformers.

Knowledge mechanisms in large language models: A survey and perspective.

A comprehensive study of knowledge editing for large language models.

2023

Unveiling the pitfalls of knowledge editing for large language models.

Editing Large Language Models: Problems, Methods, and Opportunities.

Knowledge Rumination for Pre-trained Language Models.

Schema-aware reference as prompt improves data-efficient knowledge graph construction.

2022 and Earlier

Kformer: Knowledge injection in transformer feed-forward layers.

Adapt-and-distill: Developing small, fast and effective pretrained language models for domains.