Ming Yin

Citeras av

	Alla	Sedan 2019
Citat	573	573
h-index	11	11
i10-index	11	11

240

120

180

202020212022202320245 69 122 224 151

Offentlig åtkomst

Visa alla

9 artiklar

0 artiklar

tillgänglig

inte tillgänglig

Enligt krav från finansiärer

Medförfattare

Yu-Xiang WangAssociate Professor of Computer Science, UC Santa BarbaraVerifierad e-postadress på cs.ucsb.edu
Mengdi WangCenter for Statistics & Machine Learning, ECE, Princeton UniversityVerifierad e-postadress på princeton.edu
Yu BaiResearch Scientist, Salesforce ResearchVerifierad e-postadress på salesforce.com
Wenhu ChenAssistant Professor at University of WaterlooVerifierad e-postadress på uwaterloo.ca
Yaqi DuanDepartment of Technology, Operations and Statistics at NYU SternVerifierad e-postadress på stern.nyu.edu
Huan SunAssociate Professor & CoE Innovation Scholar, The Ohio State UniversityVerifierad e-postadress på osu.edu
Thanh Nguyen-TangJohns Hopkins UniversityVerifierad e-postadress på cs.jhu.edu
Raman AroraDepartment of Computer Science, Johns Hopkins UniversityVerifierad e-postadress på cs.jhu.edu
Yingbin LiangThe Ohio State UniversityVerifierad e-postadress på osu.edu
Svetha VenkateshAlfred Deakin Professor, Deakin UniversityVerifierad e-postadress på deakin.edu.au
Yi-An MaUC San DiegoVerifierad e-postadress på ucsd.edu
William Yang WangMellichamp Chair Professor, University of California, Santa BarbaraVerifierad e-postadress på cs.ucsb.edu
Doina PrecupDeepMind and McGill UniversityVerifierad e-postadress på cs.mcgill.ca
Shoham SabachAssociate Professor, Technion, Faculty of Data and Decision SciencesVerifierad e-postadress på technion.ac.il
Andrea ZanetteAssistant Professor, Carnegie Mellon UniversityVerifierad e-postadress på andrew.cmu.edu
Yu SuDistinguished Assistant Professor, Computer Science and Engineering, Ohio State UniversityVerifierad e-postadress på osu.edu
Masatoshi UeharaGenentechVerifierad e-postadress på gene.com

Följ

Ming Yin

Princeton University

Verifierad e-postadress på princeton.edu - Startsida

Machine learning Offline Reinforcement Learning Artificial Intelligence


Titel Sortera efter citat Sortera efter år Sortera efter titel	Citeras av Citeras av	År
Near-optimal provable uniform convergence in offline policy evaluation for reinforcement learning M Yin, Y Bai, YX Wang (AISTATS oral) International Conference on Artificial Intelligence and …, 2021	86*	2021
Towards instance-optimal offline reinforcement learning with pessimism M Yin, YX Wang (NeurIPS) Advances in neural information processing systems 34, 4065-4078, 2021	75	2021
Asymptotically efficient off-policy evaluation for tabular reinforcement learning M Yin, YX Wang (AISTATS) International Conference on Artificial Intelligence and Statistics …, 2020	72	2020
Near-optimal offline reinforcement learning with linear representation: Leveraging variance information with pessimism M Yin, Y Duan, M Wang, YX Wang (ICLR) Internation Conference on Learning Representations, 2022, 2022	69	2022
Near-optimal offline reinforcement learning via double variance reduction M Yin, Y Bai, YX Wang (NeurIPS) Advances in neural information processing systems 34, 7677-7688, 2021	69	2021
Mmmu: A massive multi-discipline multimodal understanding and reasoning benchmark for expert agi X Yue, Y Ni, K Zhang, T Zheng, R Liu, G Zhang, S Stevens, D Jiang, ... (CVPR Oral) Conference on Computer Vision and Pattern Recognition, 2024	56	2024
Theoremqa: A theorem-driven question answering dataset W Chen, M Yin, M Ku, P Lu, Y Wan, X Ma, J Xu, X Wang, T Xia (EMNLP) Empirical Methods in Natural Language Processing, 2023	41	2023
Optimal uniform ope and model-based offline reinforcement learning in time-homogeneous, reward-free and task-agnostic settings M Yin, YX Wang (NeurIPS) Advances in neural information processing systems 34, 12890-12903, 2021	25	2021
Sample-efficient reinforcement learning with loglog (t) switching cost D Qiao, M Yin, M Min, YX Wang (ICML) International Conference on Machine Learning, 18031-18061, 2022	24	2022
Offline reinforcement learning with differentiable function approximation is provably efficient M Yin, M Wang, YX Wang (ICLR) Internation Conference on Learning Representations, 2023, 2023	14	2023
On Instance-Dependent Bounds for Offline Reinforcement Learning with Linear Function Approximation T Nguyen-Tang, M Yin, S Gupta, S Venkatesh, R Arora (AAAI) AAAI Conference on Artificial Intelligence, 2023, 2023	13	2023
Logarithmic switching cost in reinforcement learning beyond linear mdps D Qiao, M Yin, YX Wang (ISIT) IEEE International Symposium on Information Theory, 2024	6	2024
Non-stationary Reinforcement Learning under General Function Approximation S Feng, M Yin, R Huang, YX Wang, J Yang, Y Liang (ICML) International Conference on Machine Learning, 2023	5	2023
Offline Stochastic Shortest Path: Learning, Evaluation and Towards Optimality M Yin, W Chen, M Wang, YX Wang (UAI) The 38th Conference on Uncertainty in Artificial Intelligence, 2022	5	2022
No-Regret Linear Bandits beyond Realizability C Liu, M Yin, YX Wang (UAI) The 39th Conference on Uncertainty in Artificial Intelligence, 2023	3	2023
Why quantization improves generalization: Ntk of binary weight neural networks K Zhang, M Yin, YX Wang arXiv preprint arXiv:2206.05916, 2022	3	2022
Posterior Sampling with Delayed Feedback for Reinforcement Learning with Linear Function Approximation M Yin, NL Kuang, M Wang, YX Wang, YA Ma (NeurIPS) Advances in neural information processing systems, 2023, 2023	2	2023
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data S Madhow, D Xiao, M Yin, YX Wang 3rd Offline RL Workshop: Offline RL as a''Launchpad'', 2022	2	2022
Model-free algorithm with improved sample efficiency for zero-sum markov games S Feng, M Yin, YX Wang, J Yang, Y Liang arXiv preprint arXiv:2308.08858, 2023	1	2023
On the Data Complexity of Problem-Adaptive Offline Reinforcement Learning M Yin UC Santa Barbara, 2023	1*	2023

Systemet kan inte utföra åtgärden just nu. Försök igen senare.

Artiklar 1–20

Citat per år

Dubblettcitat

Sammanfogade citat

Lägg till medförfattareMedförfattare

Följ

Citeras av

Medförfattare