我工作中的一项任务让我陷入了困境.我需要使用DistilBERT来解决多类文本分类问题,但关键是这个数据集非常巨大--我们说的是millions of samples!
我一直在摆弄它,DistilBERT看起来确实做得很好.然而,培训永远需要时间,以下是我的两难境地:
Model Training
:我怎样才能让DistilBERT更高效地处理这个数据集的野兽呢?有没有人有过调整培训策略、批量、学习速度等方面的经验?
Hardware Constraints
:有什么硬件魔术可以施展吗?大肆挥霍购买一颗精美的图形处理器是唯一的方法吗?还是有一些我不知道的诀窍?
Inference Speed
:我还需要确保模型在训练后能够快速对新数据进行分类.我有什么 Select ?
任何帮助都是救命稻草!