Cory McLean

Cory is a staff software engineer in Google Health who leads the Genomics research team. His research interests broadly include applying machine learning to the analysis and interpretation of genomic data and publishing tools and methods as open-source software. Prior to Google, Cory was at 23andMe where he developed algorithms and tools to improve identity-by-descent detection, haplotype phasing, and genotype imputation, and the application of genetic association study results to drug development. Cory received a PhD in computer science from Stanford, where he developed computational methods to understand vertebrate gene regulation, and a BS in computer science from MIT.

Research Areas

Authored Publications

Google Publications

Other Publications

Longitudinal fundus imaging and its genome-wide association analysis provides evidence for a human retinal aging clock

Sara Ahadi

Kenneth A Wilson Jr,

Boris Babenko

Cory McLean

Drew Bryant

Orion Pritchard

Ajay Kumar

Enrique M Carrera

Ricardo Lamy

Jay M Stewart

Avinash Varadarajan

Marc Berndl

Pankaj Kapahi

Ali Bashir

eLife (2023)

Multimodal LLMs for health grounded in individual-specific data

Anastasiya Belyaeva

Justin Cosentino

Farhad Hormozdiari

Krish Eswaran

Shravya Shetty

Greg Corrado

Andrew Carroll

Cory McLean

Nick Furlotte

ICML Workshop on Machine Learning for Multimodal Healthcare Data (2023)

Inference of chronic obstructive pulmonary disease with deep learning on raw spirograms identifies new genetic loci and improves risk models

Justin Cosentino

Babak Behsaz

Babak Alipanahi

Zachary Ryan Mccaw

Davin Hill

Tae-Hwi Schwantes-An

Dongbing Lai

Andrew Carroll

Brian Hobbs

Michael Cho

Cory McLean

Farhad Hormozdiari

Nature Genetics (2023)

Unsupervised representation learning improves genomic discovery for lung function and respiratory disease prediction

Taedong Yun

Justin Cosentino

Babak Behsaz

Zachary Ryan Mccaw

Davin Hill

Robert Luben

Dongbing Lai

John Bates

Howard Yang

Tae-Hwi Schwantes-An

Yuchen Zhou

Anthony Khawaja

Andrew Carroll

Brian Hobbs

Michael Cho

Cory McLean

Farhad Hormozdiari

medRxiv (2023)

Accurate human genome analysis with Element Avidity sequencing

Alexey Kolesnikov

Andrew Carroll

Bryan Lajoie

Cory McLean

Daniel Cook

Kelly N. Blease

Kishwar Shafin

Lucas Brambrink

Maria Nattestad

Pi-Chuan Chang

Semyon Kruglyak

bioRxiv (2023)

DeepNull models non-linear covariate effects to improve phenotypic prediction and association power

Zachary R. Mccaw

Thomas Colthurst

Taedong Yun

Nicholas A. Furlotte

Andrew Carroll

Babak Alipanahi

Cory Y. McLean

Farhad Hormozdiari

Nature Communications (2022)

DeepConsensus improves the accuracy of sequences with a gap-aware sequence transformer

Aaron Wenger

Alexey Kolesnikov

Andrew Walker Carroll

Armin Töpfer

Ashish Teku Vaswani

Cory McLean

Daniel Cook

Felipe Llinares

Gunjan Baid

Howard Cheng-Hao Yang

Jean-Philippe Vert

Kishwar Shafin

Maria Nattestad

Pi-Chuan Chang

Quentin Berthet

Taedong Yun

Waleed Ammar

William J. Rowell

Nature Biotechnology (2022)

An Empirical Study of ML-based Phenotyping and Denoising for Improved Genomic Discovery

Bo Yuan

Cory McLean

Farhad Hormozdiari

Justin Cosentino

bioRxiv (2022)

How DeepConsensus Works

Aaron Wenger

Alexey Kolesnikov

Anastasiya Belyaeva

Andrew Carroll

Armin Töpfer

Ashish Teku Vaswani

Cory McLean

Daniel Cook

Felipe Llinares

Gunjan Baid

Howard Yang

Jean-Philippe Vert

Kishwar Shafin

Maria Nattestad

Pi-Chuan Chang

Quentin Berthet

Ted Yun

Waleed Ammar

William J. Rowell

(2022)

Knowledge distillation for fast and accurate DNA sequence correction

Anastasiya Belyaeva

Joel Shor

Daniel Cook

Kishwar Shafin

Daniel Liu

Armin Töpfer

Aaron Wenger

William J. Rowell

Howard Yang

Alexey Kolesnikov

Cory McLean

Andrew Carroll

Maria Nattestad

Pi-Chuan Chang

Learning Meaningful Representations of Life (LMRL) Workshop NeurIPS 2022

DeepNull models non-linear covariate effects to improve phenotypic prediction and association power

Andrew Carroll

Babak Alipanahi

Cory McLean

Farhad Hormozdiari

Ted Yun

Thomas Colthurst

Zachary Ryan Mccaw

Nick Furlotte

Nature Communications (2022)

DeepTrio: Variant Calling in Families Using Deep Learning

Alexey Kolesnikov

Cory McLean

Gunjan Baid

Howard Yang

Maria Nattestad

Pi-Chuan Chang

Sidharth Goel

Ted Yun

bioRxiv (2021)

Machine learning guided aptamer discovery

Ali Bashir

Annalisa Pawlosky

Cory McLean

Geoff Davis

George Edward Dahl

Marc Berndl

Michelle Therese Dimon

Qin Yang

Scott Ferguson

Stephan Hoyer

Zan Armstrong

Nature Communications (2021)

Large-scale machine learning-based phenotyping significantly improves genomic discovery for optic nerve head morphology

Babak Alipanahi

Farhad Hormozdiari

Babak Behsaz

Justin Thomas Cosentino

Zachary Ryan Mccaw

Emanuel Schorsch

D. Sculley

Lizzie Dorfman

Sonia Phene

Naama Hammel

Andrew Walker Carroll

Anthony Khawaja

Cory McLean

American Journal of Human Genetics (2021)

Accurate, scalable cohort variant calls using DeepVariant and GLnexus

Taedong Yun

Helen Li

Pi-Chuan Chang

Michael F. Lin

Andrew Walker Carroll

Cory McLean

Bioinformatics (2021)

SLOE: A Faster Method for Statistical Inference in High-Dimensional Logistic Regression

Steve Yadlowsky

Taedong Yun

Cory McLean

Alexander D'Amour

Advances in Neural Information Processing Systems (2021)

A population-specific reference panel for improved genotype imputation in African Americans

Jared O’Connell

Taedong Yun

Meghan Moreno

Helen Li

Nadia Litterman

Alexey Kolesnikov

Elizabeth Noblin

Pi-Chuan Chang

Anjali Shastri

Elizabeth H. Dorfman

Suyash Shringarpure

23andMe Research Team

Adam Auton

Andrew Carroll

Cory Y. McLean

Communications Biology (2021)

Underspecification Presents Challenges for Credibility in Modern Machine Learning

Alexander Nicholas D'Amour

Katherine Heller

Dan Moldovan

Ben Adlam

Babak Alipanahi

Alex Beutel

Christina Chen

Jon Deaton

Jacob Eisenstein

Matthew D. Hoffman

Farhad Hormozdiari

Shaobo Hou

Neil Houlsby

Ghassen Jerfel

Alan Karthikesalingam

Mario Lučić

Yian Ma

Cory McLean

Diana Mincu

Akinori Mitani

Andrea Montanari

Zachary Nado

Vivek Natarajan

Christopher Nielsen

Thomas Osborne

Rajiv Raman

Kim Ramasamy

Rory Abbott Sayres

Jessica Schrouff

Martin Gamunu Seneviratne

Shannon Sequeira

Harini Suresh

Victor Veitch

Max Vladymyrov

Xuezhi Wang

Kellie Webster

Steve Yadlowsky

Taedong Yun

Xiaohua Zhai

D. Sculley

Journal of Machine Learning Research (2020)

Improved non-human variant calling using species-specific DeepVariant models

Taedong Yun

Cory McLean

Pi-Chuan Chang

Andrew Carroll

(2019)

An open resource for accurately benchmarking small variant and reference calls

Justin M. Zook

Jennifer McDaniel

Nathan D. Olson

Justin M. Wagner

Hemang Parikh

Haynes Heaton

Sean A. Irvine

Len Trigg

Rebecca Truty

Cory Y. McLean

Francisco M. De La Vega

Chunlin Xiao

Stephen Sherry

Marc Salit

Nature Biotechnology, vol. 37 (2019), 561–566

GenomeWarp: an alignment-based variant coordinate transformation

Cory Y. McLean

Yeongwoo Hwang

Ryan Poplin

Mark A. DePristo

Bioinformatics (2019)

Sequential regulatory activity prediction across chromosomes with convolutional neural networks

David Kelley

Yakir Reshef

Max Bileschi

David Belanger

Cory McLean

Jasper Roland Snoek

Genome Research (2018)

A universal SNP and small-indel variant caller using deep neural networks

Ryan Poplin

Pi-Chuan Chang

David Alexander

Scott Schwartz

Thomas Colthurst

Alexander Ku

Dan Newburger

Jojo Dijamco

Nam Nguyen

Pegah T. Afshar

Sam S. Gross

Lizzie Dorfman

Cory Y. McLean

Mark A. DePristo

Nature Biotechnology (2018)

A deep learning approach to pattern recognition for short DNA sequences

Akosua Busia

George Dahl

Clara Fannjiang

David Alexander

Lizzie Dorfman

Ryan Poplin

Cory McLean

Pi-Chuan Chang

Mark DePristo

bioArxiv (2018)

Improving Phenotypic Measurements in High-Content Imaging Screens

D. Mike Ando

Cory McLean

Marc Berndl

bioRxiv (2017)

No Results Found

Search on Google Scholar

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Cory McLean

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Cory McLean

Research Areas

Filter by:

Year

Research Area

Team

Join us

AI/ML Foundations  & Capabilities