首頁?行業  »   正文

Facebook發布PyTorch Hub,用于重現AI模型結果

Facebook發布PyTorch Hub,用于重現AI模型結果

可重現性是許多研究領域的基本要求,包括基于機器學習技術的研究領域。然而,許多機器學習出版物要么不可再現,要么難以復制。

為了支持人工智能模型的可重現性,Facebook發布了beta版的Pytorch Hub,這是用于支持研究可重現性技術的API和工作流程,為改善機器學習研究的可重現性提供了基本的構建模塊。

PyTorch Hub包含一個經過預訓練的模型庫,專門用于促進研究的可重現性和新的研究。它還內置了對Colab的支持,與Papers With Code集成,目前包含一系列廣泛的模型,包括分類和分段,生成,變換器等。

在模型發布后,PyTorch Hub可以訪問將近20個模型,包括英偉達的模型。還有許多音頻和生成模型,以及使用ImageNet數據庫訓練的計算機視覺模型。

使用指南

Pytorch Hub無需下載模型,可以非常簡單地用代碼調用模型。

至于如何使用,分為兩種情況:

對于發布者,Pytorch Hub可以通過添加hubconf.py文件快速將預訓練模型發布到Github庫,并使用Github pull請求發布模型。Pythorch Hub支持Google Colab和PaperswithCode中的模型。

最簡單的案例:torchvision’s?hubconf.py:

# Optional list of dependencies required by the package
dependencies = ['torch']

from torchvision.models.alexnet import alexnet
from torchvision.models.densenet import densenet121, densenet169, densenet201, densenet161
from torchvision.models.inception import inception_v3
from torchvision.models.resnet import resnet18, resnet34, resnet50, resnet101, resnet152,\
resnext50_32x4d, resnext101_32x8d
from torchvision.models.squeezenet import squeezenet1_0, squeezenet1_1
from torchvision.models.vgg import vgg11, vgg13, vgg16, vgg19, vgg11_bn, vgg13_bn, vgg16_bn, vgg19_bn
from torchvision.models.segmentation import fcn_resnet101, deeplabv3_resnet101
from torchvision.models.googlenet import googlenet
from torchvision.models.shufflenetv2 import shufflenet_v2_x0_5, shufflenet_v2_x1_0
from torchvision.models.mobilenet import mobilenet_v2

在torchvision,模型具有以下屬性:

  • 每個模型文件都可以獨立運行和執行
  • 不需要PyTorch以外的任何包
  • 不需要單獨的入口點,因為模型在創建時可以無縫地開箱即用

對于用戶,PyTorch Hub允許你按照幾個簡單的步驟執行以下操作:

  • 探索可用的模型
  • 加載模型
  • 了解任何給定模型可用的方法

具體案例可參考官方博客。

隨著研究出版物數量的持續增長,包括目前在ARXIV上發表的數萬篇論文和提交給會議的高水平論文,研究的可重現性比以往都更重要。

團隊表示,“我們的目標是策劃高質量、易于復制、最大限度地有益于研究可重現性的模型。因此,我們可能會與大家合作,完善請求,在某些情況下,甚至拒絕一些低質量的模型發布。”

Facebook發布PyTorch Hub,用于重現AI模型結果

公開代碼

這個消息是在加利福尼亞州長灘舉行的國際機器學習會議(ICML)中發布的。今年,ICML首次鼓勵研究人員在研究的同時提交代碼,以證明研究結果。

大約提交的論文中的36%,以及通過的論文中的67%都公開了代碼。2018年人工智能指數報告發現,在政府、學術和企業研究人員撰寫的研究論文數量穩步增長的情況下,ICML是最受歡迎的年度人工智能會議之一。

科技型大學相關的研究人員相比公司或企業相關的研究人員更傾向公開代碼,學術界提交的內容中90%包括代碼,而只有27.4%的公司或企業相關研究人員公開了代碼。

Kamalika Chaudhuri和Ruslan Salakhutdinov在會議上分享了ICML公開代碼的結果,他表示:“我們希望未來的項目主席將繼續并改進這一過程,使社區朝著即時代碼發布和提高可重現性的文化邁進。”對于AI的發展來說,這也是相當有利的舉措。

博客與示例:

pytorch.org/blog/towards-reproducible-research-with-pytorch-hub

測試版本:

pytorch.org/hub

歡迎關注ATYUN官方公眾號,商務合作及內容投稿請聯系郵箱:[email protected]

發表評論