new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

May 22

Submitted by

xiaochonglinghu

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

GD-ML

Submitted by

Ukpkmkkk

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?

utokyo-ai

The University of Tokyo

Submitted by

Cardlnal

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

·
3 authors

Submitted by

zzzhr97

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Simplified-Reasoning

Simplified Reasoning

Submitted by

zykRichard

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

RTP-LLM

1

Submitted by

groundhogLLM

ACC: Compiling Agent Trajectories for Long-Context Training

ustc-community

University of Science and Technology of China

1

Submitted by

Ziqi

PhysX-Omni: Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects

·
8 authors

Submitted by

zbhpku

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

KlingTeam

Submitted by

SeanWu25

Forecasting Scientific Progress with Artificial Intelligence

Oxford

University of Oxford

Submitted by

taesiri

Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning

UIUC-CS

University of Illinois at Urbana-Champaign

Submitted by

YJ-142150

WorldKV: Efficient World Memory with World Retrieval and Compression

kaist-ai

Submitted by

Nova2001

SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers

uoft-cs

University of Toronto Computer Science

1

Submitted by

jhpark96

FlowLong: Inference-time Long Video Generation via Manifold-constrained Tweedie Matching

kaist-ai

Submitted by

sibasmarakp

Unsupervised Process Reward Models

·
5 authors

2

Submitted by

Zuica96

SpaceDG: Benchmarking Spatial Intelligence under Visual Degradation

Visionary-Laboratoary

Visionary-Laboratoary

Submitted by

jiahaoplus

Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving

google

Submitted by

Jinyang23

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles

·
10 authors

Submitted by

taesiri

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

nvidia

Submitted by

ttu1818

Q-ARVD: Quantizing Autoregressive Video Diffusion Models

NationalUniversityofSingapore

National University of Singapore

Submitted by

Bturtel

Training Large Language Models to Predict Clinical Events

LightningRodLabs

Lightning Rod Labs

Submitted by

Ephemeral182

GenEvolve: Self-Evolving Image Generation Agents via Tool-Orchestrated Visual Experience Distillation

Submitted by

CapitalLiu

KVServe: Service-Aware KV Cache Compression for Communication-Efficient Disaggregated LLM Serving

ict-cas

Institute of Computing Technology, Chinese Academy of Sciences

Submitted by

arkilpatel

Forecasting Downstream Performance of LLMs With Proxy Metrics

McGill-NLP

McGill NLP Group

Submitted by

Master-Shi

One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems

NanyangTechnologicalUniversity

Nanyang Technological University

Submitted by

Chtholly17

ClinSeekAgent: Automating Multimodal Evidence Seeking for Agentic Clinical Reasoning

UCSC-VLAA

Submitted by

dahyekim

Swift Sampling: Selecting Temporal Surprises via Taylor Series

BostonU

Boston University

1

Submitted by

VoyageWang

Segment Anything with Motion, Geometry, and Semantic Adaptation for Complex Nonlinear Visual Object Tracking

Tsinghua University

Submitted by

beomjin-ahn

LoREnc: Low-Rank Encryption for Securing Foundation Models and LoRA Adapters

SamsungResearch

Samsung Research

2

Submitted by

mingkaid

Efficient Agentic Reasoning Through Self-Regulated Simulative Planning

sailing-lab

SAILING Lab (CMU & MBZUAI)

Submitted by

jhcho99

SceneAligner: 3D-Grounded Floorplan Localization in the Wild

cornell

Cornell University

Submitted by

taesiri

Bernini: Latent Semantic Planning for Video Diffusion

ByteDance

Submitted by

dora2023

Diversed Model Discovery via Structured Table Discovery

UWaterloo

University of Waterloo

Submitted by

Johnson0213

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment

lmarena-ai

Submitted by

taesiri

TerminalWorld: Benchmarking Agents on Real-World Terminal Tasks

EuniAI

Submitted by

VictorYeste

More Context, Larger Models, or Moral Knowledge? A Systematic Study of Schwartz Value Detection in Political Texts

·
2 authors

Submitted by

taesiri

From Reasoning Chains to Verifiable Subproblems: Curriculum Reinforcement Learning Enables Credit Assignment for LLM Reasoning

·
6 authors

Submitted by

Songweii

DecQ: Detail-Condensing Queries for Enhanced Reconstruction and Generation in Representation Autoencoders

·
6 authors

Submitted by

EunsuKim

"I didn't Make the Micro Decisions": Measuring, Inducing, and Exposing Goal-Level AI Contributions in Collaboration

·
4 authors

Submitted by

nandan523

Same Architecture, Different Capacity: Optimizer-Induced Spectral Scaling Laws

New York University

Submitted by

pablomm

Platonic Representations in the Human Brain: Unsupervised Recovery of Universal Geometry

UniversitatDeBarcelona

Universitat de Barcelona

Submitted by

wuyangchen

Lean Refactor: Multi-Objective Controllable Proof Optimization via Agentic Strategy Search

·
7 authors

1

Submitted by

jusjinuk

Rule2DRC: Benchmarking LLM Agents for DRC Script Synthesis with Execution-Guided Test Generation

SeoulNatlUniv

Seoul National University

Submitted by

ZacharyNovack

Live Music Diffusion Models: Efficient Fine-Tuning and Post-Training of Interactive Diffusion Music Generators

·
11 authors

Submitted by

Breezelled

AnyMo: Geometry-Aware Setup-Agnostic Modeling of Human Motion in the Wild

CRUISEResearchGroup

CRUISE Research Group (UNSW)

Submitted by

wdika

Disentangling Sampling from Training Budget in Class-Imbalanced CT Body Composition Segmentation

·
3 authors

Submitted by

xxayt

OmniPro: A Comprehensive Benchmark for Omni-Proactive Streaming Video Understanding

·
7 authors

Submitted by

luoxue-star

SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild

·
7 authors

Submitted by

HaokunWen

FashionLens: Toward Versatile Fashion Image Retrieval via Task-Adaptive Learning

·
6 authors

1

Submitted by

pastifra

Minimalist Visual Inertial Odometry

columbia

Columbia University