分割済みコーパスからのカタカナ複合語抽出に誤りがありました。論文では 「分割済みコーパスに目立った効果が認められない」としましたが、修正後の 分割済みコーパスを用いて再実験すると、ユニグラム・モデルと前向きバイグ ラム・モデルについて精度が向上しました。後ろ向きバイグラム・モデルでは なぜか精度が若干低下しました。 表3: 分割済みカウントの効果 分割済みあり | .646 (.657/.636) .624 | .582 (.594/.570) .555 | .572 (.586/.559) .547 表4: 共起する用言の効果 用言 + 分割済み | .588 (.599/.577) .560 .609 | .594 (.601/.588) .566 .612 表5: 言い換え表現の効果 言換 + 分済 | .679 (.683/.676) .659 | .645 (.645/.646) .614 | .628 (.630/.625) .600