declanjackson - Hacker News

HN

Articles by declanjackson

12

Show HN: AA-Briefcase: a frontier knowledge work evaluation (artificialanalysis.ai)

18 hours ago declanjackson artificialanalysis.ai

5

AA-Omniscience: Evaluating Cross-Domain Knowledge Reliability in Language Models (arxiv.org)

7 months ago declanjackson arxiv.org