Huiqiang Jiang

Research SDE 2

Decorative graphic with wavy shapes in the background in blues and purples. Text overlay in center left reads: “Research Focus: August 26, 2024”

Microsoft Research Blog

Research Focus: Week of August 26, 2024

August 28, 2024

Learn what’s next for AI at Research Forum on Sept. 3;  WizardArena simulates human-annotated chatbot games; MInference speeds pre-filling for long-context LLMs via dynamic sparse attention; Reef: Fast succinct non-interactive zero-knowledge regex proofs.

Microsoft Research Blog

Research Focus: Week of April 15, 2024

April 17, 2024

In this issue: New research on appropriate reliance on generative AI; Power management opportunities for LLMs in the cloud; LLMLingua-2 improves task-agnostic prompt compression; Enhancing COMET to embrace under-resourced African languages:

Microsoft Research Blog

LLMLingua: Innovating LLM efficiency with prompt compression

December 7, 2023 | Huiqiang Jiang, Qianhui Wu, Chin-Yew Lin, Yuqing Yang, and Lili Qiu

Advanced prompting technologies for LLMs can lead to excessively long prompts, causing issues. Learn how LLMLingua compresses prompts up to 20x, maintaining quality, reducing latency, and supporting improved UX.

Huiqiang Jiang

News & features

Research Focus: Week of August 26, 2024

Research Focus: Week of April 15, 2024

LLMLingua: Innovating LLM efficiency with prompt compression

Contact Huiqiang Jiang

Microsoft Research Lab – Asia