#

adversarial-ml

Here are 128 public repositories matching this topic...

DanOps-1 / Gpt-Agreement-Payment

ChatGPT Plus/Team/Pro 订阅协议端到端重放工具集 · hCaptcha 视觉求解器 · 反欺诈机制实证研究 / End-to-end protocol replay toolkit for ChatGPT Plus/Team/Pro subscription with from-scratch hCaptcha solver and empirical anti-fraud research

stripe bug-bounty mitmproxy captcha-solver ctf-tools anti-fraud vlm playwright adversarial-ml hcaptcha-solver chatgpt protocol-replay

Updated Jun 15, 2026
Python

depalmar / ai_for_the_win

Build AI-powered security tools. 50+ hands-on labs covering ML, LLMs, RAG, threat detection, DFIR, and red teaming. Includes Colab notebooks, Docker environment, and CTF challenges.

Updated Jun 1, 2026
Python

AmirhosseinHonardoust / Noise-Injection-Techniques

Noise Injection Techniques provides a comprehensive exploration of methods to make machine learning models more robust to real-world bad data. This repository explains and demonstrates Gaussian noise, dropout, mixup, masking, adversarial noise, and label smoothing, with intuitive explanations, theory, and practical code examples.

Updated Nov 15, 2025

AI-Security-Research-Group / LLM-Attacks

Comprehensive taxonomy of AI security vulnerabilities, LLM adversarial attacks, prompt injection techniques, and machine learning security research. Covers 71+ attack vectors including model poisoning, agentic AI exploits, and privacy breaches.

machine-learning ai-security ai-privacy open-source-security adversarial-ml prompt-injection ai-red-teaming model-poisoning llm-attacks ai-vulnerabilities security-taxonomy

Updated Sep 19, 2025

sparckix / ztare

Autonomous research engine for generating, testing, and governing auditable claims across science, proofs, and high-stakes projects.

artificial-intelligence formal-verification multi-agent-systems ai-safety zero-trust ai-alignment adversarial-robustness neurosymbolic lean4 adversarial-ml trustworthy-ai ai-governance llm-evaluation recursive-ai

Updated Jun 19, 2026
Python

ruwgxo / ai-security-mastery

90-day learning path from ML fundamentals to production AI security systems

python machine-learning deep-learning jupyter-notebook owasp cybersecurity security-engineering security-research mitre-attack ai-security threat-detection open-source-book detection-engineering adversarial-ml ai-red-team prompt-injection llm-security

Updated Jun 12, 2026
Python

MadsDoodle / Detecting-the-Machine-A-Comprehensive-Benchmark-of-AI-Generated-Text-Detectors-Across-Architectures

This project aims to address this gap by conducting a systematic, controlled study of human versus LLM-generated text detectability using paired question–answer datasets. Rather than proposing a novel detection architecture, the focus is on analyzing detection robustness, failure modes, and the impact of adversarial humanization strategies.

nlp benchmarking text-classification transformers xgboost stylometry bert model-evaluation electra perplexity roberta domain-generalization adversarial-ml ai-evaluation llm-detection ai-generated-text-detection llm-benchmarks

Updated Mar 19, 2026
Jupyter Notebook

praetorian-inc / model-extraction-demo

An application to demonstrate stealing an AI model through knowledge distillation.

security ai model offsec adversarial-ml llm-security

Updated Dec 1, 2025
Python

byoniq / AI-Redteaming

Curated LLM/AI attack tools — prompt injection, jailbreaks, agentic threats, adversarial ML, MCP attack surface

red-teaming ai-security adversarial-ml offensive-ai prompt-injection llm-security ai-red-teaming llm-attacks

Updated May 18, 2026

issdandavis / SCBE-AETHERMOORE

Geometric AI governance and evaluation framework with a 14-layer security pipeline, semantic projection, and reproducible benchmark lanes.

Updated Jun 19, 2026
Python

emmanuelgjr / GenAI-Security-Literature-Review

Comprehensive, auto-updating literature review of GenAI & LLM security research, standards, tools, and resources. 100+ curated entries with interactive webapp.

owasp cybersecurity jailbreaking ai-safety literature-review red-teaming machine-learning-security ai-security adversarial-ml mitre-atlas prompt-injection llm-security genai-security agentic-ai nist-ai-rmf

Updated Jun 14, 2026
Python

bb1nfosec / dvai

DVAI - Damn Vulnerable AI Ecosystem. Open-source, zero-infrastructure-cost AI red team training range.

nextjs ctf red-team ai-security groq vercel adversarial-ml prompt-injection mutation-engine logprob

Updated May 28, 2026
TypeScript

krishnakaanthreddyy1510-cell / RedSOC

An adversarial evaluation framework for LLM-integrated Security Operations Centers

python cybersecurity soc red-teaming ai-security adversarial-ml large-language-models prompt-injection llm-security rag-security

Updated May 5, 2026
Python

clolomagico123 / ai-security-lab

🤖 Test and secure AI systems with advanced techniques for Large Language Models, including jailbreaks and automated vulnerability scanners.

incident-response dfir ctf offensive-security blue-team adversarial-attacks ai-security cybersecurity-education hands-on-labs adversarial-ml llm ai-red-team prompt-injection langchain-alternative agentic-ai-security llm-attacks

Updated Jun 16, 2026

ParraX123 / meta-ai-bug-bounty

🛡️ Discover and analyze critical vulnerabilities in Meta AI's Instagram Group Chat, ensuring robust security through comprehensive testing and reporting.

cybersecurity penetration-testing ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated Jun 16, 2026

failurefirst / failure-first

Adversarial evaluation framework for embodied and agentic AI — failure-first methodology, jailbreak corpus, VLA red-teaming, and policy research.

benchmark robotics jailbreak alignment vla ai-safety red-teaming failure-analysis responsible-ai embodied-ai adversarial-ml llm-evaluation safety-research agentic-ai

Updated Jun 16, 2026
Astro

zakky8 / llm-jailbreak-taxonomy

Mechanism-grounded taxonomy of 40 LLM jailbreak patterns across 10 categories. 8,000-trial bootstrap evaluation for the June 2026 frontier (Claude Opus 4-8, GPT-5.5, Gemini 3.5, DeepSeek V4). Every citation direct-WebFetch verified; refuted claims documented.

taxonomy jailbreak alignment ai-safety security-testing responsible-disclosure jailbreak-detection adversarial-attacks red-teaming ai-security model-robustness adversarial-ml prompt-injection red-teaming-tools llm-security llm-evaluation llm-jailbreaks ai-red-teaming adversarial-testing

Updated Jun 2, 2026
Jupyter Notebook

Ashfaaq98 / ai-security-research

A collection of resources documenting my research and learning journey in AI System Security.

research resources ai-security adversarial-ml llm-security agentic-ai ai-red-teaming

Updated May 21, 2026

shahram-h-hesari / ai-ml-wifi-sensing-hub

Open research hub mapping AI/ML WiFi sensing papers, datasets, code, reproducibility, and security gaps, starting with healthcare-relevant sensing.

machine-learning signal-processing artificial-intelligence dataset cybersecurity csi wifi-sensing healthcare-ai adversarial-ml wireless-sensing

Updated Jun 1, 2026

donbaudin / meta-ai-bug-bounty

Bug bounty report demonstrating prompt injection and command execution vulnerabilities in Meta AI's Instagram Group Chat

cybersecurity penetration-testing bug-bounty ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated May 31, 2025

Improve this page

Add a description, image, and links to the adversarial-ml topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the adversarial-ml topic, visit your repo's landing page and select "manage topics."