Back to Projects

Star NLP — 文本偏见消除系统

基于 VAE 的文本偏见消除框架,支持 Independence / Separation / Sufficiency 三大标准

PythonPyTorchVAENLP

Overview

  • 基于 Star 框架的文本偏见消除系统
  • 通过 VAE(变分自编码器)实现文本表示的偏见消除
  • 在多个偏见评估指标上取得显著提升

核心方法

  • 使用 VAE 对文本表示进行解耦,分离语义信息与敏感属性信息
  • 支持三种偏见消除标准:Independence / Separation / Sufficiency
  • 采用 SentimentaDutch 数据集,以 UF-score 作为评估指标

实验结果

  • UF-score 从基线 68% 降至 47%(DF-LA + INLP)
  • BLIND-MABR 基线 UF-score: 0.82
  • VAE 的 cTPR_rms 达到 0.152 → 0.133

关键技术

  • VAE 变分自编码器 — 对文本表示进行解耦
  • 公平性约束优化 — 在训练过程中加入偏见约束
  • 文本表示解耦 — 分离语义与敏感属性