Huggingface榜首开源模子惹争议:魔改Apache协议,抵达确定门槛要收钱
开源又没残缺开源 。首开
咱们知道,源模议魔议抵Huggingface 是惹争 AI 规模驰名的开源平台 ,任何人以及机构都可能在该平台上宣告自己以及运用他人的达确定门模子、数据集,槛收为业内提供了钻研利便 。首开因此它深受 AI 圈的源模议魔议抵喜爱,其最受招待的惹争 Transformer 库已经在 GitHub 上收获 102k 的 Star 量。
不外克日 ,达确定门由 TII 开拓并宣告在 Huggingface 上的槛收一个大模子激发了普遍争议。该大模子是首开 400 亿参数的因果解码器模子 Falcon-40B ,它在 RefinedWeb 的源模议魔议抵 1000B token 上妨碍磨炼,并运用精选数据集增强。惹争它在 Huggingface 的达确定门 OpenLLM 排行榜上排首位,其功能优于 LLaMA、槛收MPT、RedPajama 以及 StableLM 等 。
排行榜地址 :https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
尽管 Falcon-40B 模子自己很强盛 ,但其凭证的开源协议却在开源圈引起了轩然大波 。它在一个应承商业运用的允许证下可用,即如下 TII Falcon LLM License。
开源协议:https://huggingface.co/tiiuae/falcon-40b/blob/main/LICENSE.txt
该允许证部份基于 Apache License Version 2.0。Apache License 2.0 协议来自驰名的 Apache 基金会,它对于商业运用友好。运用者可能在需要的时候更正代码来知足需要并作为开源或者商业产物宣告 / 销售 。
但有人发现了 TII Falcon LLM License 的一些「猫腻」 。推特用户 @natfriedman 总结了它与 Apache License 2.0 开源允许的相似与差距之处。其中相似之处在于都付与运用、更正以及散发允许作品的普遍允许,要求在散发中搜罗允许文本以及归属,并具备责任限度 、保障宽免权。
不外差距在于,TII Falcon LLM License 要求一旦抵达支出门槛,需支出商业用途特许权运用费 ,而大少数开源允许不需要。TII Falcon LLM License 对于若何宣告或者分爆发品也有格外限度, 好比要求归属于「Falcon LLM technology from the Technology Innovation Institute」 。
同时,TII Falcon LLM License 不应承在其余差距的允许下重新授权作品 ,而大少数开源允许应承衍生作品凭证差距的协议取患上允许。TII Falcon LLM License 还清晰地清扫了 Falcon LLM 的某些版本 / 巨细的允许 ,而开源允许个别适用于所有版本。
最后 ,TII Falcon LLM License 对于更正源代码以及目的代码都有格外的要求