ABDULLAH AL RAFI

Comprehensive Research Tools for Life Sciences

1. Bioinformatics & Genomics

Sequence Analysis & Alignment

BLAST (Basic Local Alignment Search Tool)

NCBI's tool for comparing primary biological sequence information

Primary Use: Sequence similarity searching against nucleotide/protein databases
Typical Workflow: 1) Input query sequence in FASTA format, 2) Select appropriate database (nr, RefSeq, etc.), 3) Adjust parameters (E-value, word size), 4) Submit search, 5) Analyze results (alignments, E-values)

Clustal Omega

Multiple sequence alignment program for protein and DNA sequences

Primary Use: Creating multiple sequence alignments for phylogenetic analysis
Typical Workflow: 1) Input sequences in FASTA format (upload file or paste), 2) Set output format (ALN, PHYLIP, etc.), 3) Adjust alignment parameters if needed, 4) Submit job, 5) Download alignment file

MAFFT

Multiple sequence alignment program with fast and accurate algorithms

Primary Use: Large-scale multiple sequence alignments
Command-line Example: mafft --auto input.fasta > output.aln
Web Server Steps: 1) Upload sequence file, 2) Select strategy (Auto, FFT-NS-2, etc.), 3) Submit job, 4) Download results

Bowtie2/BWA

Ultrafast and memory-efficient tools for aligning sequencing reads

Primary Use: Mapping NGS reads to reference genomes
Bowtie2 Example: bowtie2 -x reference_index -1 reads_1.fq -2 reads_2.fq -S output.sam
BWA Example: 1) Index reference: bwa index reference.fa
2) Align reads: bwa mem reference.fa reads_1.fq reads_2.fq > output.sam

SAMtools/BCFtools

Utilities for manipulating alignments in SAM/BAM/CRAM format

Primary Use: Processing NGS alignment files and variant calling
Common Commands: 1) Convert SAM to BAM: samtools view -Sb input.sam > output.bam
2) Sort BAM: samtools sort input.bam -o sorted.bam
3) Index BAM: samtools index sorted.bam
4) Variant calling: bcftools mpileup -f ref.fa sorted.bam | bcftools call -mv -o variants.vcf

Genome Assembly & Annotation

SPAdes

Genome assembly toolkit containing various assembly pipelines

Primary Use: Assembling genomes from Illumina, PacBio, or Oxford Nanopore reads
Basic Command: spades.py -o output_dir -1 reads_1.fastq -2 reads_2.fastq
Key Options: --isolate (for single-cell), --careful (reduces mismatches), --meta (for metagenomes)

Prokka

Rapid prokaryotic genome annotation pipeline

Primary Use: Automated annotation of bacterial genomes
Basic Command: prokka --outdir annotation --prefix strain_name genome.fasta
Output Includes: Gene predictions (GFF), protein sequences (FAA), nucleotide sequences (FFN), annotation report (TXT)

Augustus

Gene prediction program for eukaryotic genomes

Primary Use: Predicting genes in eukaryotic genomes
Basic Command: augustus --species=human genome.fa > predictions.gff
Key Features: Can use hints from RNA-seq or protein alignments to improve predictions

RAST

Rapid Annotation using Subsystem Technology server

Primary Use: Automated annotation of microbial genomes
Web Interface Steps: 1) Upload genome sequence, 2) Select annotation options, 3) Submit job, 4) Retrieve results via email
Output Includes: Functional assignments, metabolic pathway reconstruction, subsystem coverage

Variant Analysis & Population Genetics

GATK (Genome Analysis Toolkit)

Variant discovery in high-throughput sequencing data

Primary Use: SNP and indel calling in human genomes
Basic Workflow: 1) Mark duplicates: gatk MarkDuplicates
2) Base quality recalibration: gatk BaseRecalibrator
3) Variant calling: gatk HaplotypeCaller
4) Variant filtering: gatk VariantFiltration

PLINK

Whole-genome association analysis toolset

Primary Use: GWAS analysis and population genetics
Common Analyses: 1) Quality control: plink --file data --missing
2) PCA: plink --file data --pca
3) Association: plink --file data --assoc
File Formats: Uses PED/MAP or BED/BIM/FAM formats

VEP (Variant Effect Predictor)

Tool to determine the effect of genomic variants

Primary Use: Annotating variants with functional consequences
Basic Command: vep -i variants.vcf -o annotated.txt
Key Options: --cache (uses local cache), --plugin (adds plugins), --format (input format)

Structural Bioinformatics

PyMOL

Molecular visualization system for 3D structures

Primary Use: Visualization and analysis of protein structures
Basic Commands: 1) Load PDB: fetch 1abc
2) Show as cartoon: show cartoon
3) Color by chain: util.cbc
4) Save image: ray 2000,2000; png image.png

Chimera/ChimeraX

Interactive visualization and analysis of molecular structures

Primary Use: Advanced molecular visualization and analysis
Key Features: - Volume data (cryo-EM) visualization
- Structure-sequence alignment
- Surface area calculations
- Command scripting with Python

SWISS-MODEL

Automated protein structure homology modeling

Primary Use: Creating 3D models of protein sequences
Web Interface Steps: 1) Input target sequence, 2) Select templates, 3) Build model, 4) Evaluate quality
Output Includes: Model coordinates (PDB), quality estimates, alignment with templates

I-TASSER

Hierarchical protein structure modeling approach

Primary Use: Protein structure prediction when few templates available
Submission Steps: 1) Input sequence, 2) Specify parameters (if any), 3) Submit job, 4) Wait for email results
Output Includes: Predicted 3D models, confidence scores, functional annotations

AlphaFold

AI system for protein structure prediction

Primary Use: Highly accurate protein structure prediction
Web Interface Steps: 1) Input protein sequence (up to 1400 residues), 2) Submit job, 3) Download results
Key Outputs: Predicted structure (PDB), per-residue confidence scores (pLDDT), predicted aligned error

Transcriptomics & Epigenomics

DESeq2/edgeR

Differential gene expression analysis from RNA-seq

Primary Use: Identifying differentially expressed genes
Basic R Workflow (DESeq2): 1) Create DESeqDataSet object
2) Run DESeq: dds <- DESeq(dds)
3) Get results: res <- results(dds, contrast=c("condition","treated","control"))
4) Filter significant genes: resSig <- subset(res, padj < 0.05)

STAR/HISAT2

Ultrafast RNA-seq aligners

Primary Use: Aligning RNA-seq reads to reference genomes
STAR Example: 1) Build genome index: STAR --runMode genomeGenerate --genomeDir index --genomeFastaFiles genome.fa
2) Align reads: STAR --genomeDir index --readFilesIn reads.fq --outFileNamePrefix output
HISAT2 Example: hisat2 -x genome_index -1 reads_1.fq -2 reads_2.fq -S output.sam

MACS2

Model-based analysis of ChIP-seq data

Primary Use: Identifying transcription factor binding sites
Basic Command: macs2 callpeak -t ChIP.bam -c Control.bam -f BAM -g hs -n experiment_name
Output Includes: Peak locations (BED), summit positions, fold enrichment values

Cell Ranger

Analysis pipeline for 10x Genomics single-cell RNA-seq

Primary Use: Processing single-cell gene expression data
Basic Workflow: 1) Build reference: cellranger mkref --genome=ref --fasta=genome.fa --genes=genes.gtf
2) Process samples: cellranger count --id=sample1 --transcriptome=ref --fastqs=fastq_dir
Output Includes: Gene-barcode matrices, clustering results, differential expression

Metagenomics & Microbiome

QIIME2/mothur

Microbiome analysis pipelines

Primary Use: Analyzing microbial community sequencing data
QIIME2 Basic Workflow: 1) Import sequences: qiime tools import
2) Denoise: qiime dada2 denoise-paired
3) Taxonomy: qiime feature-classifier classify-sklearn
4) Diversity: qiime diversity core-metrics-phylogenetic

MetaPhlAn/Kraken2

Metagenomic taxonomic profiling tools

Primary Use: Identifying microbial composition from shotgun metagenomics
MetaPhlAn Example: metaphlan input.fastq --input_type fastq --bowtie2out metagenome.bowtie2.bz2 > profile.txt
Kraken2 Example: kraken2 --db k2_standard --threads 8 --report report.txt input.fastq > output.kraken

MG-RAST

Metagenomics analysis server

Primary Use: Automated analysis of metagenomic sequences
Web Interface Steps: 1) Upload sequences, 2) Select analysis parameters, 3) Submit job, 4) Explore results online
Analysis Includes: Taxonomic profiling, functional annotation, comparative analysis

2. Drug Design & Computational Chemistry

Molecular Docking & Virtual Screening

AutoDock Vina/GNINA

Programs for molecular docking and virtual screening

Primary Use: Predicting small molecule binding to protein targets
Basic Workflow: 1) Prepare receptor (PDBQT): prepare_receptor4.py -r protein.pdb
2) Prepare ligand (PDBQT): prepare_ligand4.py -l ligand.pdb
3) Define search space: write_gpf.py
4) Run docking: vina --receptor protein.pdbqt --ligand ligand.pdbqt --config config.txt

Schrödinger Suite (Glide, Maestro)

Commercial software for drug discovery

Primary Use: Comprehensive drug discovery platform
Typical Workflow: 1) Protein preparation (ProPrep), 2) Grid generation (Glide), 3) Docking, 4) Scoring
Key Modules: - Glide: High-throughput virtual screening
- Desmond: Molecular dynamics simulations
- QikProp: ADME prediction

GOLD

Genetic algorithm for protein-ligand docking

Primary Use: Flexible ligand and protein docking
Typical Workflow: 1) Prepare protein (add hydrogens, define binding site), 2) Prepare ligands (generate conformers), 3) Set genetic algorithm parameters, 4) Run docking, 5) Analyze results

SWISS-DOCK

Web service for protein-ligand docking

Primary Use: Quick docking predictions without local installation
Web Interface Steps: 1) Upload protein structure or select from PDB, 2) Input ligand (draw or upload), 3) Select docking parameters, 4) Submit job, 5) View and download results

Molecular Dynamics (MD) Simulations

GROMACS/AMBER/NAMD

Molecular dynamics simulation packages

Primary Use: Simulating biomolecular systems over time
GROMACS Basic Workflow: 1) System preparation: gmx pdb2gmx -f protein.pdb -o processed.gro
2) Solvation: gmx solvate -cp protein.gro -o solvated.gro
3) Energy minimization: gmx grompp -f em.mdp -c solvated.gro -p topol.top -o em.tpr
4) Production MD: gmx mdrun -deffnm md

OpenMM

High-performance toolkit for molecular simulations

Primary Use: GPU-accelerated molecular dynamics
Python Example:


                    from openmm.app import *

                    from openmm import *

                    pdb = PDBFile('input.pdb')

                    system = forcefield.createSystem(pdb.topology)

                    integrator = LangevinMiddleIntegrator(300*kelvin, 1/picosecond, 0.002*picoseconds)

                    simulation = Simulation(pdb.topology, system, integrator)

                    simulation.reporters.append(PDBReporter('output.pdb', 1000))

                    simulation.step(10000)

CHARMM

Molecular simulation program with force fields

Primary Use: All-atom simulations of biomolecules
Typical Workflow: 1) Read PSF and coordinate files, 2) Apply force field parameters, 3) Energy minimization, 4) Equilibration, 5) Production dynamics
Key Features: Extensive force fields (CHARMM36), implicit/explicit solvent models

Pharmacophore Modeling & QSAR

LigandScout

Pharmacophore modeling and virtual screening

Primary Use: Creating 3D pharmacophore models from protein-ligand complexes
Typical Workflow: 1) Import protein-ligand complex, 2) Generate pharmacophore features, 3) Validate model, 4) Screen compound libraries
Key Features: Structure-based and ligand-based pharmacophore modeling

MOE (Molecular Operating Environment) div class="tool-desc">Commercial software for molecular modeling and drug discovery

Primary Use: Comprehensive computational chemistry platform
Key Modules: - SVL: Scientific vector language for automation
- QSAR: Quantitative structure-activity relationship modeling
- Pharmacophore: 3D pharmacophore modeling
- Docking: Molecular docking simulations

RDKit/ChemAxon

Open-source cheminformatics toolkits

Primary Use: Cheminformatics and molecular property calculations
RDKit Python Example:


                    from rdkit import Chem

                    from rdkit.Chem import Descriptors

                    mol = Chem.MolFromSmiles('Cc1ccccc1')

                    print(Descriptors.MolWt(mol))

ChemAxon Features: MarvinSketch (chemical drawing), JChem (database tools), Calculator Plugins (property prediction)

ADMET Prediction

SwissADME

Web tool for pharmacokinetics and drug-likeness prediction

Primary Use: Early-stage drug property prediction
Web Interface Steps: 1) Input molecules (draw, paste SMILES, or upload file), 2) Submit calculation, 3) View results (drug-likeness, bioavailability radar, physicochemical properties)
Key Predictions: Lipinski's rule of five, solubility, permeability, CYP450 metabolism

admetSAR

Comprehensive ADMET prediction system

Primary Use: Predicting absorption, distribution, metabolism, excretion, toxicity
Web Interface Steps: 1) Input molecules (single or batch), 2) Select prediction models, 3) Submit job, 4) Download results (CSV format)
Key Features: Over 40 predictive models, including BBB penetration, Ames mutagenicity, hERG inhibition

ProTox-II

Prediction of chemical toxicity

Primary Use: In silico toxicity assessment
Web Interface Steps: 1) Input chemical (draw, SMILES, or name), 2) Submit prediction, 3) View toxicity predictions (organ toxicity, toxicity pathways, LD50)
Key Features: Predicts 33 toxicity endpoints, including hepatotoxicity and carcinogenicity

Comprehensive Research Tools for Life Sciences

1. Bioinformatics & Genomics

Sequence Analysis & Alignment

Genome Assembly & Annotation

Variant Analysis & Population Genetics

Structural Bioinformatics

Transcriptomics & Epigenomics

Metagenomics & Microbiome

2. Drug Design & Computational Chemistry

Molecular Docking & Virtual Screening

Molecular Dynamics (MD) Simulations

Pharmacophore Modeling & QSAR

ADMET Prediction

3. Neurobiology & Neuroscience

Neuroimaging & Brain Mapping

Most Popular

Type 3c Diabetes Mellitus: A Distinct and Overlooked Form of Diabetes

The Future of Medicine: How Bispecific Antibodies Are Revolutionizing Targeted Therapies

Translate

Wikipedia

Facebook Page

Linkedin

Total Pageviews

Menu Footer Widget

Contact form

Comprehensive Research Tools for Life Sciences

1. Bioinformatics & Genomics

Sequence Analysis & Alignment

Genome Assembly & Annotation

Variant Analysis & Population Genetics

Structural Bioinformatics

Transcriptomics & Epigenomics

Metagenomics & Microbiome

2. Drug Design & Computational Chemistry

Molecular Docking & Virtual Screening

Molecular Dynamics (MD) Simulations

Pharmacophore Modeling & QSAR

ADMET Prediction

3. Neurobiology & Neuroscience

Neuroimaging & Brain Mapping

Social Profiles

Most Popular

Type 3c Diabetes Mellitus: A Distinct and Overlooked Form of Diabetes

The Future of Medicine: How Bispecific Antibodies Are Revolutionizing Targeted Therapies

Translate

Wikipedia

Facebook Page

Linkedin

Total Pageviews

Menu Footer Widget

Contact form