Nitish Shirish Keskar

Citeras av

	Alla	Sedan 2019
Citat	11851	11162
h-index	28	27
i10-index	41	41

3100

1550

775

2325

20172018201920202021202220232024136 504 1003 1556 1692 2174 3012 1714

Offentlig åtkomst

Visa alla

5 artiklar

0 artiklar

tillgänglig

inte tillgänglig

Enligt krav från finansiärer

Medförfattare

Richard Socheryou.comVerifierad e-postadress på stanford.edu
Caiming XiongSalesforce ResearchVerifierad e-postadress på salesforce.com
Bryan McCannYou.comVerifierad e-postadress på you.com
Jorge NocedalProfessor, Industrial Engineering, Northwestern UniversityVerifierad e-postadress på NORTHWESTERN.EDU
Dheevatsa MudigereDistinguished Engineer, NVIDIAVerifierad e-postadress på nvidia.com
Mikhail SmelyanskiyFacebookVerifierad e-postadress på intel.com
Lav R. VarshneyUniversity of Illinois Urbana-ChampaignVerifierad e-postadress på illinois.edu
Stephen MerityVerifierad e-postadress på smerity.com
Nikhil NaikMITVerifierad e-postadress på mit.edu
Akhilesh Deepak GotmareSalesforce ResearchVerifierad e-postadress på salesforce.com
Ali MadaniProfluent BioVerifierad e-postadress på berkeley.edu
Nazneen RajaniHugging FaceVerifierad e-postadress på huggingface.co
Huan WangSalesforce ResearchVerifierad e-postadress på yale.edu
Semih YavuzSalesforce ResearchVerifierad e-postadress på salesforce.com
Albert S. BerahasAssistant Professor, University of MichiganVerifierad e-postadress på umich.edu
Karim AhmedDartmouth College, Samsung Research AmericaVerifierad e-postadress på dartmouth.edu
Tong NiuSalesforce ResearchVerifierad e-postadress på salesforce.com
Raphael R EguchiStanford UniversityVerifierad e-postadress på alumni.stanford.edu
Jasdeep SinghStanford UniversityVerifierad e-postadress på stanford.edu
Wojciech KryścińskiCohereVerifierad e-postadress på cohere.com

Följ

Nitish Shirish Keskar

OpenAI

Verifierad e-postadress på openai.com - Startsida

Deep Learning Mathematical Optimization Natural Language Processing


Titel Sortera efter citat Sortera efter år Sortera efter titel	Citeras av Citeras av	År
On large-batch training for deep learning: Generalization gap and sharp minima NS Keskar, D Mudigere, J Nocedal, M Smelyanskiy, PTP Tang arXiv preprint arXiv:1609.04836, 2016	3329	2016
Gpt-4 technical report J Achiam, S Adler, S Agarwal, L Ahmad, I Akkaya, FL Aleman, D Almeida, ... arXiv preprint arXiv:2303.08774, 2023	1291*	2023
Regularizing and optimizing LSTM language models S Merity, NS Keskar, R Socher arXiv preprint arXiv:1708.02182, 2017	1263	2017
Ctrl: A conditional transformer language model for controllable generation NS Keskar, B McCann, LR Varshney, C Xiong, R Socher arXiv preprint arXiv:1909.05858, 2019	1087	2019
Beyond the imitation game: Quantifying and extrapolating the capabilities of language models A Srivastava, A Rastogi, A Rao, AAM Shoeb, A Abid, A Fisch, AR Brown, ... arXiv preprint arXiv:2206.04615, 2022	724	2022
The natural language decathlon: Multitask learning as question answering B McCann, NS Keskar, C Xiong, R Socher arXiv preprint arXiv:1806.08730, 2018	649	2018
Improving generalization performance by switching from adam to sgd NS Keskar, R Socher arXiv preprint arXiv:1712.07628, 2017	621	2017
Neural text summarization: A critical evaluation W Kryściński, NS Keskar, B McCann, C Xiong, R Socher arXiv preprint arXiv:1908.08960, 2019	375	2019
Gedi: Generative discriminator guided sequence generation B Krause, AD Gotmare, B McCann, NS Keskar, S Joty, R Socher, ... arXiv preprint arXiv:2009.06367, 2020	296	2020
A closer look at deep learning heuristics: Learning rate restarts, warmup and distillation A Gotmare, NS Keskar, C Xiong, R Socher arXiv preprint arXiv:1810.13243, 2018	276	2018
Progen: Language modeling for protein generation A Madani, B McCann, N Naik, NS Keskar, N Anand, RR Eguchi, ... arXiv preprint arXiv:2004.03497, 2020	232	2020
An analysis of neural language modeling at multiple scales S Merity, NS Keskar, R Socher arXiv preprint arXiv:1803.08240, 2018	188	2018
Deep learning-enabled breast cancer hormonal receptor status determination from base-level H&E stains N Naik, A Madani, A Esteva, NS Keskar, MF Press, D Ruderman, DB Agus, ... Nature communications 11 (1), 5727, 2020	173	2020
Weighted transformer network for machine translation K Ahmed, NS Keskar, R Socher arXiv preprint arXiv:1711.02132, 2017	155	2017
Balancing communication and computation in distributed optimization AS Berahas, R Bollapragada, NS Keskar, E Wei IEEE Transactions on Automatic Control 64 (8), 3141-3155, 2018	114	2018
Sequence-to-sequence prediction using a neural network model NS Keskar, K Ahmed, R Socher US Patent 11,928,600, 2024	107	2024
Multitask learning as question answering NS Keskar, B McCann, C Xiong, R Socher US Patent 11,501,076, 2022	86	2022
Multitask learning as question answering B McCann, NS Keskar, C Xiong, R Socher US Patent 10,776,581, 2020	83	2020
Hybrid training of deep networks NS Keskar, R Socher US Patent 11,276,002, 2022	78	2022
Xlda: Cross-lingual data augmentation for natural language inference and question answering J Singh, B McCann, NS Keskar, C Xiong, R Socher arXiv preprint arXiv:1905.11471, 2019	77	2019

Systemet kan inte utföra åtgärden just nu. Försök igen senare.

Artiklar 1–20

Citat per år

Dubblettcitat

Sammanfogade citat

Lägg till medförfattareMedförfattare

Följ

Citeras av

Medförfattare