自定义#

本节演示了 ASR 模型的自定义选项。这些选项可以用于流式和离线 API。

词语增强#

词语增强允许您通过在解码声学模型的输出时为感兴趣的特定词语分配更高的分数,从而使 ASR 引擎偏向于识别这些词语。我们建议增强分数在 20 到 100 之间。

python3 python-clients/scripts/asr/transcribe_file.py --server 0.0.0.0:50051 \
    --language-code en-US \
    --input-file en-US_sample.wav \
    --boosted-lm-words "nature" \
    --boosted-lm-score 30

上述命令将打印如下所示的文本记录。在此示例中,模型能够生成包含 nature 而不是 natural 的文本记录。

## what is nature language processing

自动标点#

可以通过传递标志 --automatic-punctuation 来启用自动标点和 capitalization(首字母大写)。

python3 python-clients/scripts/asr/transcribe_file.py --server 0.0.0.0:50051 \
    --input-file en-US_sample.wav \
    --language-code en-US \
    --automatic-punctuation

上述命令将打印如下所示的带有标点和 capitalization(首字母大写)的文本记录。

## What is natural language processing?

注意

Whisper 和 Canary 模型不支持上述任何自定义参数。