Joakim Lee's picture

633

Joakim Lee

Reinforcement4All

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

PRL: Process Reward Learning Improves LLMs' Reasoning Ability and Broadens the Reasoning Boundary

upvoted a paper 1 day ago

LSRIF: Logic-Structured Reinforcement Learning for Instruction Following

upvoted a paper 1 day ago

Action100M: A Large-scale Video Action Dataset

View all activity

Organizations

None yet

upvoted 13 papers 1 day ago

PRL: Process Reward Learning Improves LLMs' Reasoning Ability and Broadens the Reasoning Boundary

Paper • 2601.10201 • Published 4 days ago • 7

LSRIF: Logic-Structured Reinforcement Learning for Instruction Following

Paper • 2601.06431 • Published 9 days ago • 9

Action100M: A Large-scale Video Action Dataset

Paper • 2601.10592 • Published 4 days ago • 21

PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution

Paper • 2601.10657 • Published 4 days ago • 17

Molmo2: Open Weights and Data for Vision-Language Models with Video Understanding and Grounding

Paper • 2601.10611 • Published 4 days ago • 23

Transition Matching Distillation for Fast Video Generation

Paper • 2601.09881 • Published 5 days ago • 28

Think-Then-Generate: Reasoning-Aware Text-to-Image Diffusion with LLM Encoders

Paper • 2601.10332 • Published 4 days ago • 26

CoF-T2I: Video Models as Pure Visual Reasoners for Text-to-Image Generation

Paper • 2601.10061 • Published 5 days ago • 28

Toward Ultra-Long-Horizon Agentic Science: Cognitive Accumulation for Machine Learning Engineering

Paper • 2601.10402 • Published 4 days ago • 34

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

Paper • 2601.07641 • Published 7 days ago • 42

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning

Paper • 2601.09667 • Published 5 days ago • 76

Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

Paper • 2601.08763 • Published 6 days ago • 129

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published 5 days ago • 169

upvoted 7 papers 4 days ago

Agent-as-a-Judge

Paper • 2601.05111 • Published 11 days ago • 16

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published 5 days ago • 112

Controlled Self-Evolution for Algorithmic Code Optimization

Paper • 2601.07348 • Published 7 days ago • 108

Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning

Paper • 2601.09708 • Published 5 days ago • 48

MAXS: Meta-Adaptive Exploration with LLM Agents

Paper • 2601.09259 • Published 5 days ago • 89

A^3-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation

Paper • 2601.09274 • Published 5 days ago • 79

ExpSeek: Self-Triggered Experience Seeking for Web Agents

Paper • 2601.08605 • Published 6 days ago • 15