GeneDisco competition 1st place submission (team pycd)

We won the challenge🤩!

We used Random Network Distilation model (code snippet) for our final submission. Please refer to the paper to learn more about the method.

GeneDisco: A benchmark for active learning in drug discovery

In vitro cellular experimentation with genetic interventions, using for example CRISPR technologies, is an essential step in early-stage drug discovery and target validation that serves to assess initial hypotheses about causal associations between biological mechanisms and disease pathologies. With billions of potential hypotheses to test, the experimental design space for in vitro genetic experiments is extremely vast, and the available experimental capacity - even at the largest research institutions in the world - pales in relation to the size of this biological hypothesis space.

GeneDisco (published at ICLR-22) is a benchmark suite for evaluating active learning algorithms for experimental design in drug discovery. GeneDisco contains a curated set of multiple publicly available experimental data sets as well as open-source i mplementations of state-of-the-art active learning policies for experimental design and exploration.

GeneDisco ICLR-22 Challenge

Visualization

Please note that it is possible to open genedisco-pycd/genedisco/visualization/visualization_2.ipynb, even though it's too large to view it on github. To do that, open the notebook as a raw file, copy its content, and save it on your local machine as an .ipynb file. The notebook contains some of our latest visualization comparisons that we used to choose the best performing acquisition function among those we tried.

License

GeneDisco benchmark is licensed under Apache License.

Contributions from pycd team are licensed under MIT License:

genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/core_set.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/core_set2.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/core_setUMAP.py 
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/ensemble_rnd.py 
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/rnd.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/rnd_05.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/uncertainty_acquisition.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/uncertainty_acquisition_03.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/uncertainty_acquisition_05.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/uncertainty_acquisition_07.py
genedisco-pycd/genedisco/active_learning_methods/acquisition_functions/uncertainty_acquisition_10.py
genedisco-pycd/genedisco/visualization/visualization_2.ipynb
genedisco-pycd/genedisco/visualization/viz.py
genedisco-pycd/genedisco/visualization/viz_utils.py

PYCD Team

Panagiotis Tigas (@ptigas)
Yashas Annadani (@yashasannadani)
Chris Emezue (@ChrisEmezue)
Daria Yasafova (@DariaYasafova)

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
genedisco		genedisco
.gitignore		.gitignore
LICENSE.txt		LICENSE.txt
LICENSE_MIT.md		LICENSE_MIT.md
MANIFEST.in		MANIFEST.in
README.md		README.md
acq.sh		acq.sh
job.sh		job.sh
log_file_rnd.txt		log_file_rnd.txt
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py
special.py		special.py
wslurm.sh		wslurm.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Licenses found

Repository files navigation

GeneDisco competition 1st place submission (team pycd)

We won the challenge🤩!

GeneDisco: A benchmark for active learning in drug discovery

GeneDisco ICLR-22 Challenge

Visualization

License

PYCD Team

About

Licenses found

Releases

Packages

Contributors 3

Languages

License

Licenses found

chrisemezue/genedisco-pycd

Folders and files

Latest commit

History

Repository files navigation

GeneDisco competition 1st place submission (team pycd)

We won the challenge🤩!

GeneDisco: A benchmark for active learning in drug discovery

GeneDisco ICLR-22 Challenge

Visualization

License

PYCD Team

About

Resources

License

Licenses found

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages