Molecultron: TAAR1 Hybrid AI Drug Discovery System

Student: Hassan Almosa (Alia0024) Course: COMP3742 Artificial Intelligence Assessment: Artefact 2 - Hybrid AI System for Drug Discovery Video Demo: [https://youtu.be/MhPdEaUov6Q] Repository: [https://github.com/gammaploid/Moleculetron/] Date: 2025-11-29

Overview

Molecultron is a hybrid AI system combining machine learning (MLP neural network) with symbolic reasoning (Prolog knowledge base) for TAAR1 drug discovery candidate assessment.

System Architecture

[INFERENCE PIPELINE]
SMILES Input --> RDKit Feature Extraction --> Load MLP Model --> pIC50 Prediction
                      |                                              |
                      v                                              v
              Molecular Properties                      Activity Classification
              (MW, LogP, TPSA, HBD, etc.)                           |
                      |                                              |
                      v                                              |
              Prolog KB Query <--------------------------------------+
                      |
                      v
              Rule Evaluation:
              - Veber (oral bioavailability)
              - CNS MPO (brain penetration)
              - TAAR1 Pharmacophore (mechanism)
              - Pfizer 3/75 (safety)
                      |
                      v
              Final Recommendation + Explanations

Files

File	Description
`hybrid_inference.py`	Main hybrid system (MLP + Prolog integration)
`train_models.py`	Training script for baseline ML models
`taar1_kb.pl`	Prolog knowledge base
`requirements.txt`	Python dependencies
`test_hybrid_system.py`	Comprehensive test suite

Setup

Prerequisites

Python >= 3.9
SWI-Prolog (for pyswip)

Installation

# Create virtual environment
python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

# Install dependencies
pip install -r requirements.txt

# Verify RDKit
python -c "from rdkit import Chem; print('RDKit OK')"

# Verify PySwip (requires SWI-Prolog installed)
python -c "from pyswip import Prolog; print('PySwip OK')"

SWI-Prolog Installation

macOS: brew install swi-prolog
Ubuntu: sudo apt install swi-prolog
Windows: Download from https://www.swi-prolog.org/download/stable

Usage

Basic Inference

from hybrid_inference import HybridInferenceSystem

# Initialize system
system = HybridInferenceSystem()

# Evaluate a compound
result = system.predict("NCCc1ccccc1")  # Phenethylamine

# Get recommendation
print(f"pIC50: {result.pchembl_predicted}")
print(f"Tier: {result.recommendation_tier}")
print(f"Explanation: {result.natural_language_explanation}")

Running Tests

python test_hybrid_system.py

Training Models

python train_models.py

Prolog Knowledge Base

The KB implements four literature-backed rule sets:

Veber Rules (Veber 2002): Oral bioavailability
CNS MPO (Wager 2010): Brain penetration score (0-5)
TAAR1 Pharmacophore (Bunzow 2001): Basic nitrogen + aromatic ring
Pfizer 3/75 (Hughes 2008): Safety filter

Model Performance

Model	Test R2	Split	Notes
XGBoost	0.292	Scaffold	Best overall
SVR	0.227	Scaffold	Best CV
MLP	0.643	Random	Inflated by split

References

Bunzow et al. (2001). Mol. Pharmacol., 60(6), 1181-1188.
Wager et al. (2010). ACS Chem. Neurosci., 1(6), 435-449.
Veber et al. (2002). J. Med. Chem., 45(12), 2615-2623.
Hughes et al. (2008). Bioorg. Med. Chem. Lett., 18(17), 4872-4875.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
Data		Data
Misc		Misc
Models		Models
Notebooks		Notebooks
Prolog		Prolog
Reports		Reports
Results		Results
Source		Source
.DS_Store		.DS_Store
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Molecultron: TAAR1 Hybrid AI Drug Discovery System

Overview

System Architecture

Files

Setup

Prerequisites

Installation

SWI-Prolog Installation

Usage

Basic Inference

Running Tests

Training Models

Prolog Knowledge Base

Model Performance

References

About

Uh oh!

Releases

Packages

Uh oh!

Languages

gammaploid/Moleculetron

Folders and files

Latest commit

History

Repository files navigation

Molecultron: TAAR1 Hybrid AI Drug Discovery System

Overview

System Architecture

Files

Setup

Prerequisites

Installation

SWI-Prolog Installation

Usage

Basic Inference

Running Tests

Training Models

Prolog Knowledge Base

Model Performance

References

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages