Publications

An Yang, Baosong Yang, Binyuan Hui, Bo Zheng, Bowen Yu, Chang Zhou, Chengpeng Li, Chengyuan Li, Dayiheng Liu, Fei Huang, Guanting Dong, Haoran Wei, Huan Lin, Jialong Tang, Jialin Wang, Jian Yang, Jian Yang, Jianhong Tu, Jianwei Zhang, Jianxin Ma, Jianxin Yang, Jin Xu, Jingren Zhou, Jinze Bai, Jinzheng He, Junyang Lin, Kai Dang, Keming Lu, Keqin Chen, Kexin Yang, Mei Li, Mingfeng Xue, Na Ni, Pei Zhang, Peng Wang, Ru Peng, Rui Men, Ruize Gao, Runji Lin, Shijie Wang, Shuai Bai, Sinan Tan, Tianhang Zhu, Tianhao Li, Tianyu Liu, Wenbin Ge, Xiaodong Deng, Xiaohuan Zhou, Xingzhang Ren, Xinyu Zhang, Xipin Wei, Xuancheng Ren, Xuejing Liu, Yang Fan, Yang Yao, Yichang Zhang, Yu Wan, Yunfei Chu, Yuqiong Liu, Zeyu Cui, Zhenru Zhang, Zhifang Guo, Zhihao Fan. Qwen2 Technical Report. [paper]

Xiangpeng Wei, Haoran Wei, Huan Lin, Tianhao Li, Pei Zhang, Xingzhang Ren, Mei Li, Yu Wan, Zhiwei Cao, Binbin Xie, Tianxiang Hu, Shangjie Li, Binyuan Hui, Bowen Yu, Dayiheng Liu, Baosong Yang, Fei Huang, and Jun Xie. PolyLM: An Open Source Polyglot Large Language Model. [paper] [13B model at modelscope] [13B SFT model at modelscope] [13B model at huggingface] [1.7B model at huggingface]

Rong Xiao*, Yu Wan*, Baosong Yang, Haibo Zhang, Huajin Tang, Derek F Wong, and Boxing Chen. 2023. Towards Energy-Preserving Natural Language Understanding with Spiking Neural Networks. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 31: 439-447. [paper]

Keqin Bao*, Yu Wan*, Dayiheng Liu, Baosong Yang, Wenqiang Lei, Xiangnan He, Derek F. Wong, and Jun Xie. Alibaba-Translate China’s Submission for WMT 2022 Quality Estimation Shared Task. In: WMT. [paper]

Yu Wan*, Keqin Bao*, Dayiheng Liu, Baosong Yang, Derek F. Wong, Lidia S. Chao, Wenqiang Lei, and Jun Xie. 2022. Alibaba-Translate China’s Submission for WMT 2022 Metrics Shared Task. In: WMT. [paper]

Yu Wan, Dayiheng Liu, Baosong Yang, Haibo Zhang, Boxing Chen, Derek Wong, and Lidia Chao. 2022. UniTE: Unified Translation Evaluation. In: ACL. [paper] [code at modelscope] [code at github]

Yu Wan*, Baosong Yang*, Dayiheng Liu, Rong Xiao, Derek Wong, Haibo Zhang, Boxing Chen, and Lidia Chao. 2022. Attention Mechanism with Energy-Friendly Operations. In: Findings@ACL. [paper] [code]

Yu Wan, Baosong Yang, Derek Fai Wong, Lidia Sam Chao, Liang Yao, Haibo Zhang, and Boxing Chen. 2022. Challenges of Neural Machine Translation for Short Texts. Computational Linguistics, 48 (2): 321–342. [paper]

Yu Wan, Dayiheng Liu, Baosong Yang, Tianchi Bi, Haibo Zhang, Boxing Chen, Weihua Luo, Derek F. Wong, and Lidia S. Chao. 2021. RoBLEURT Submission for WMT2021 Metrics Task. In: WMT. [paper]

Yu Wan, Baosong Yang, Derek F. Wong, Yikai Zhou, Lidia S. Chao, Haibo Zhang, and Boxing Chen. 2020. Self-Paced Learning for Neural Machine Translation. In: EMNLP. [paper] [code]

Yikai Zhou, Baosong Yang, Derek F. Wong, Yu Wan, and Lidia S. Chao. 2020. Uncertainty-Aware Curriculum Learning for Neural Machine Translation. In: ACL. [paper] [code]

Yu Wan*, Baosong Yang*, Derek F. Wong, Lidia S. Chao, Haihua Du, and Ben CH. Ao. 2020. Unsupervised Neural Dialect Translation with Commonality and Diversity Modeling. In: AAAI. [paper] [code]

Yu Wan, Yidong Chen, Xiaodong Shi, and Changle Zhou. 2018. Constructing and Validating Word Similarity Datasets by Integrating Methods from Psychology, Brain Science and Computational Linguistics. Soft Computing, 22(21): 6967–6979. [paper]