Jay Gala's picture

Jay Gala

jaygala24

·

https://jaygala24.github.io/

AI & ML interests

Machine Learning, Natural Language Processing, Language and Vision Intersection, Fairness and Biases

Recent Activity

updated a dataset about 20 hours ago

jaygala24/reasoning-geometry

published a dataset 2 days ago

jaygala24/reasoning-geometry

updated a collection 2 days ago

RL post-training

View all activity

Organizations

jaygala24 's models 25

jaygala24/Qwen3-4B-DAPO-math-reasoning

Text Generation • 4B • Updated 2 days ago • 541

jaygala24/Qwen3-4B-RLOO-math-reasoning

Text Generation • 4B • Updated 5 days ago • 306

jaygala24/Qwen3-1.7B-RLOO-math-reasoning

Text Generation • 2B • Updated 6 days ago • 806

jaygala24/Qwen2.5-3B-RLOO-math-reasoning

Text Generation • 3B • Updated 6 days ago • 742

jaygala24/Qwen2.5-1.5B-RLOO-math-reasoning

Text Generation • 2B • Updated 6 days ago • 701

jaygala24/Qwen2.5-0.5B-RLOO-math-reasoning

Text Generation • 0.5B • Updated 6 days ago • 653

jaygala24/Qwen3-1.7B-DAPO-math-reasoning

Text Generation • 2B • Updated 6 days ago • 686

jaygala24/Qwen2.5-3B-DAPO-math-reasoning

Text Generation • 3B • Updated 6 days ago • 677

jaygala24/Qwen2.5-1.5B-DAPO-math-reasoning

Text Generation • 2B • Updated 6 days ago • 817

jaygala24/Qwen2.5-0.5B-DAPO-math-reasoning

Text Generation • 0.5B • Updated 6 days ago • 638

jaygala24/Qwen3-4B-ReMax-math-reasoning

Text Generation • 4B • Updated 12 days ago • 854

jaygala24/Qwen3-4B-GRPO-math-reasoning

Text Generation • 4B • Updated 12 days ago • 907

jaygala24/Qwen3-4B-GRPO-KL-math-reasoning

Text Generation • 4B • Updated 12 days ago • 1.09k

jaygala24/Qwen3-1.7B-ReMax-math-reasoning

Text Generation • 2B • Updated 12 days ago • 958

jaygala24/Qwen3-1.7B-GRPO-math-reasoning

Text Generation • 2B • Updated 12 days ago • 896

jaygala24/Qwen3-1.7B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 12 days ago • 874

jaygala24/Qwen2.5-3B-ReMax-math-reasoning

Text Generation • 3B • Updated 12 days ago • 493

jaygala24/Qwen2.5-3B-GRPO-math-reasoning

Text Generation • 3B • Updated 12 days ago • 857

jaygala24/Qwen2.5-3B-GRPO-KL-math-reasoning

Text Generation • 3B • Updated 12 days ago • 843

jaygala24/Qwen2.5-1.5B-ReMax-math-reasoning

Text Generation • 2B • Updated 12 days ago • 487

jaygala24/Qwen2.5-1.5B-GRPO-math-reasoning

Text Generation • 2B • Updated 12 days ago • 615

jaygala24/Qwen2.5-1.5B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 12 days ago • 572

jaygala24/Qwen2.5-0.5B-ReMax-math-reasoning

Text Generation • 0.5B • Updated 12 days ago • 472

jaygala24/Qwen2.5-0.5B-GRPO-math-reasoning

Text Generation • 0.5B • Updated 12 days ago • 606

jaygala24/Qwen2.5-0.5B-GRPO-KL-math-reasoning

Text Generation • 0.5B • Updated 12 days ago • 573