干果广告标语

沿海时报

健康的选择：干果

随着人们健康意识的提高，越来越多的人开始选择健康的食品。作为一种天然的零食，干果因其丰富的营养和独特的口感越来越受到消费者的青睐。无论是在早餐、午餐、晚餐还是作为零食，干果都是一种健康的选择。

干果包括了许多种类，如杏仁、核桃、腰果、葡萄干、无花果等等。每种干果都有其独特的风味和营养成分。比如，核桃富含蛋白质和多不饱和脂肪酸，对心脏健康有益；而杏仁则富含纤维、蛋白质、维生素E、镁等成分，有助于控制血糖和胆固醇。

除了这些营养成分，干果还富含各种抗氧化剂和维生素，有助于保持身体健康和美容。因此，干果是一种非常适合在日常饮食中食用的零食。

如何选购干果

在挑选干果时，有一些注意事项需要注意。首先，要选择颜色均匀、没有破损的干果。有些干果上可能有一些黑斑或者油脂，这可能是由于储存或者处理不当导致的，应该避免购买。

其次，要注意干果的保存方式。干果容易吸收潮气，长时间放置容易变质，因此在购买后应该尽快食用或者储存。最好的保存方式是将干果放在密封袋中，放在阴凉干燥的地方。

最后，要注意干果的数量。尽管干果富含营养，但摄入过量可能会导致热量过高。因此，在挑选干果时要注意控制摄入量，避免过度食用。

如何烹饪干果

干果不仅可以直接食用，也可以用来烹饪各种美食。例如，可以将葡萄干加入麦片或者牛奶中，制作健康的早餐。将核桃碎片加入沙拉中，可以为沙拉增添口感和营养。将杏仁、芝麻、蜂蜜混合在一起，制作健康的小零食。

除了以上这些简单的做法，干果还可以用来制作各种美食，如干果蛋糕、干果燕麦饼干、干果能量球等等。这些美食不仅美味，而且富含各种营养成分，非常适合作为日常饮食的一部分。

结论

干果作为一种天然的零食，其富含的营养成分和独特的口感越来越受到人们的喜爱。无论是作为早餐、午餐、晚餐还是作为零食，干果都是一种健康的选择。在挑选干果时要注意颜色、形状、保存方式等因素。此外，干果还可以用来制作各种美食，非常适合作为日常饮食的一部分。因此，如果你正在寻找一种健康、美味的零食，不妨选择干果吧！

干果广告标语特色

1、随时随地和网友聊天更顺畅。

2、屏蔽陌生来电。孩子手表只能拨打/接听家庭成员和手表好友的电话，仅管理员有添加家庭成员的权限。

3、人景合一领略超燃盛唐东方古韵

4、目前该软件支持的机型很多。根据不同型号控制也非常简单方便。

5、随时随地预订周边游国内游出境游摄影游亲子游自驾游户外游城市会议和定制游

干果广告标语亮点

1、写：练习写数字0：把你的android屏幕变成一个数字石板，

2、挂机得神装，多余装备全部熔炼，为橙装进阶！

3、可以查看订单详情，可以自由选择订单。

4、每天都有优惠活动领取，让你乐享优惠

5、由搭配原料，满足各种生还者们的口味

suishisuidihewangyouliaotiangengshunchang。pingbimoshenglaidian。haizishoubiaozhinengboda/jietingjiatingchengyuanheshoubiaohaoyoudedianhua，jinguanliyuanyoutianjiajiatingchengyuandequanxian。renjingheyilinglvechaoranshengtangdongfangguyunmuqiangairuanjianzhichidejixinghenduo。genjubutongxinghaokongzhiyefeichangjiandanfangbian。suishisuidiyudingzhoubianyouguoneiyouchujingyousheyingyouqinziyouzijiayouhuwaiyouchengshihuiyihedingzhiyouUC伯(bo)克(ke)利(li)發(fa)布(bu)大(da)語(yu)言(yan)模(mo)型(xing)排(pai)行(xing)榜(bang)！Vicuna奪(duo)冠(guan)，清(qing)華(hua)ChatGLM進(jin)前(qian)5

新(xin)智(zhi)元(yuan)報(bao)道(dao)

編(bian)輯(ji)：好(hao)困(kun)

【新智元導(dao)讀(du)】萬(wan)万沒(mei)想(xiang)到(dao)，現(xian)在(zai)大语言模型們(men)也(ye)要(yao)像(xiang)王(wang)者(zhe)榮(rong)耀(yao)/LoL/Dota這(zhe)些(xie)遊(you)戲(xi)裏(li)的(de)玩(wan)家(jia)壹(yi)樣(yang)打(da)排位(wei)賽(sai)了(le)！據(ju)說(shuo)，那(na)些閉(bi)源(yuan)模型们很(hen)快(kuai)也會(hui)被(bei)拉(la)出(chu)來(lai)溜(liu)溜。

最(zui)近(jin)，来自(zi)LMSYS Org（UC伯克利主(zhu)导）的研(yan)究(jiu)人(ren)員(yuan)又(you)搞(gao)了個(ge)大新聞(wen)——大语言模型版(ban)排位赛！

顧(gu)名(ming)思(si)義(yi)，「LLM排位赛」就(jiu)是(shi)讓(rang)一群(qun)大语言模型隨(sui)機(ji)进行battle，並(bing)根(gen)据它(ta)们的Elo得(de)分(fen)进行排名。

然(ran)後(hou)，我(wo)们就能(neng)一眼(yan)看(kan)出，某(mou)个聊(liao)天(tian)机器(qi)人到底(di)是「嘴(zui)強(qiang)王者」還(hai)是「最强王者」。

劃(hua)重(zhong)點(dian)：團(tuan)隊(dui)还計(ji)划把(ba)國(guo)內(nei)和(he)国外(wai)的这些「闭源」模型都(dou)搞进来，是騾(luo)子(zi)是馬(ma)溜溜就知(zhi)道了！（GPT-3.5现在就已(yi)經(jing)在匿(ni)名競(jing)技(ji)場(chang)里了）

匿名聊天机器人竞技场長(chang)下(xia)面(mian)这样：

很明(ming)顯(xian)，模型B回(hui)答(da)正(zheng)確(que)，拿(na)下这局(ju)；而(er)模型A連(lian)題(ti)都没读懂(dong)……

項(xiang)目(mu)地(di)址(zhi)：https://arena.lmsys.org/

在當(dang)前的排行榜中(zhong)，130億(yi)參(can)數(shu)的Vicuna以(yi)1169分穩(wen)居(ju)第(di)一，同(tong)样130亿参数的Koala位列(lie)第二(er)，LAION的Open Assistant排在第三(san)。

清华提(ti)出的ChatGLM，雖(sui)然只(zhi)有(you)60亿参数，但(dan)依(yi)然沖(chong)进了前五(wu)，只比(bi)130亿参数的Alpaca落(luo)后了23分。

相(xiang)比之(zhi)下，Meta原(yuan)版的LLaMa只排到了第八(ba)（倒(dao)数第二），而Stability AI的StableLM則(ze)獲(huo)得了唯(wei)一的800+分，排名倒数第一。

团队表(biao)示(shi)，之后不(bu)僅(jin)会定(ding)期(qi)更(geng)新排位赛榜單(dan)，而且(qie)还会優(you)化(hua)算(suan)法(fa)和机制(zhi)，并根据不同的任(ren)務(wu)類(lei)型提供(gong)更加(jia)細(xi)化的排名。

目前，所(suo)有的評(ping)估(gu)代(dai)碼(ma)以及(ji)数据分析(xi)均(jun)已公(gong)布。

拉著(zhe)LLM打排位

在这次(ci)的评估中，团队選(xuan)擇(ze)了目前比較(jiao)出名的9个開(kai)源聊天机器人。

每(mei)次1v1對(dui)戰(zhan)，系(xi)統(tong)都会随机拉兩(liang)个上(shang)场PK。用(yong)戶(hu)则需(xu)要同時(shi)和这两个机器人聊天，然后決(jue)定哪(na)个聊天机器人聊的更好。

可(ke)以看到，頁(ye)面下面有4个选项，左(zuo)邊(bian)（A）更好，右(you)边（B）更好，一样好，或(huo)者都很差(cha)。

当用户提交(jiao)投(tou)票(piao)之后，系统就会显示模型的名稱(cheng)。这时，用户可以繼(ji)續(xu)聊天，或者选择新的模型重新开啟(qi)一輪(lun)对战。

不過(guo)，团队在分析时，只会采(cai)用模型是匿名时的投票結(jie)果(guo)。在经过差不多(duo)一周(zhou)的数据收(shou)集(ji)之后，团队共(gong)收获了4.7k个有效(xiao)的匿名投票。

在开始(shi)之前，团队先(xian)根据基(ji)準(zhun)測(ce)試(shi)的结果，掌(zhang)握(wo)了各(ge)个模型可能的排名。

根据这个排名，团队会让模型去(qu)优先选择更合(he)適(shi)的对手(shou)。

然后，再(zai)通(tong)过均勻(yun)采样，来获得对排名的更好總(zong)體(ti)覆(fu)蓋(gai)。

在排位赛结束(shu)时，团队又引(yin)入(ru)了一種(zhong)新模型fastchat-t5-3b。

以上这些操(cao)作(zuo)最終(zhong)导致(zhi)了非(fei)均匀的模型頻(pin)率(lv)。

每个模型組(zu)合的对战次数

從(cong)统计数据来看，大多数用户所用的都是英(ying)语，中文(wen)排在第二位。

排名前15的语言的对战次数

评估LLM，真(zhen)的很難(nan)

自从ChatGPT爆(bao)火(huo)之后，经过指(zhi)令(ling)跟(gen)随微(wei)調(tiao)的开源大语言模型如(ru)雨(yu)后春(chun)筍(sun)一般(ban)大量(liang)湧(yong)现。可以说，幾(ji)乎(hu)每周都有新的开源LLM在发布。

但問(wen)题是，评估这些大语言模型非常(chang)难。

具(ju)体来说，目前用来衡(heng)量一个模型好不好的東(dong)西(xi)基本(ben)都是基於(yu)一些學(xue)術(shu)的benchmark，比如在一个某个NLP任务上構(gou)建(jian)一个测试数据集，然后看测试数据集上准确率多少(shao)。

然而，这些学术benchmark（如HELM）在大模型和聊天机器人上就不好用了。其(qi)原因(yin)在于：

1. 由(you)于评判(pan)聊天机器人聊得好不好这件(jian)事(shi)是非常主觀(guan)的，因此(ci)现有的方(fang)法很难对其进行衡量。

2. 这些大模型在訓(xun)練(lian)的时候(hou)就几乎把整(zheng)个互(hu)聯(lian)網(wang)的数据都掃(sao)了一个遍(bian)，因此很难保(bao)證(zheng)测试用的数据集没有被看到过。甚(shen)至(zhi)更进一步(bu)，用测试集直(zhi)接(jie)对模型进行「特(te)训」，如此一来表现必(bi)然更好。

3. 理(li)論(lun)上我们可以和聊天机器人聊任何(he)事情(qing)，但很多話(hua)题或者任务在现存(cun)的benchmark里面根本就不存在。

那如果不想采用这些benchmark的话，其實(shi)还有一條(tiao)路(lu)可以走(zou)——花(hua)錢(qian)請(qing)人来給(gei)模型打分。

实際(ji)上，OpenAI就是这麽(me)搞的。但是这个方法明显很慢(man)，而且更重要的是，太(tai)貴(gui)了……

為(wei)了解(jie)决这个棘(ji)手的问题，来自UC伯克利、UCSD、CMU的团队发明了一种既(ji)好玩又实用的全(quan)新机制——聊天机器人竞技场（Chatbot Arena）。

相比而言，基于对战的基准系统具有以下优勢(shi)：

可擴(kuo)展(zhan)性(xing)（Scalability）

当不能为所有潛(qian)在的模型对收集足(zu)夠(gou)的数据时，系统應(ying)能扩展到盡(jin)可能多的模型。

增(zeng)量性（Incrementality）

系统应能够使(shi)用相对较少的试驗(yan)次数评估新模型。

唯一順(shun)序(xu)（Unique order）

系统应为所有模型提供唯一顺序。给定任意(yi)两个模型，我们应該(gai)能够判斷(duan)哪个排名更高(gao)或它们是否(fou)并列。

Elo评分系统

Elo等(deng)級(ji)分制度(du)（Elo rating system）是一种计算玩家相对技能水(shui)平(ping)的方法，廣(guang)泛(fan)应用在竞技游戏和各类運(yun)動(dong)当中。其中，Elo评分越(yue)高，那么就说明这个玩家越厲(li)害(hai)。

比如英雄(xiong)联盟(meng)、Dota 2以及吃(chi)雞(ji)等等，系统给玩家进行排名的就是这个机制。

舉(ju)个例(li)子，当妳(ni)在英雄联盟里面打了很多场排位赛后，就会出现一个隱(yin)藏(zang)分。这个隐藏分不仅决定了你的段(duan)位，也决定了你打排位时碰(peng)到的对手基本也是类似(si)水平的。

而且，这个Elo评分的数值(zhi)是絕(jue)对的。也就是说，当未(wei)来加入新的聊天机器人时，我们依然可以直接通过Elo的评分来判断哪个聊天机器人更厉害。

具体来说，如果玩家A的评分为Ra，玩家B的评分为Rb，玩家A获勝(sheng)概(gai)率的精(jing)确公式(shi)（使用以10为底的logistic曲(qu)線(xian)）为：

然后，玩家的评分会在每场对战后线性更新。

假(jia)設(she)玩家A（评分为Ra）預(yu)计获得Ea分，但实际获得Sa分。更新该玩家评分的公式为：

1v1胜率

此外，作者还展示了排位赛中每个模型的对战胜率以及使用Elo评分估算的预测对战胜率。

结果显示，Elo评分确实可以相对准确地进行预测

所有非平局A对B战鬥(dou)中模型A胜利的比例

在A对B战斗中，使用Elo评分预测的模型A的胜率

作者介(jie)紹(shao)

「聊天机器人竞技场」由前小(xiao)羊(yang)駝(tuo)作者机构LMSYS Org发布。

该机构由UC伯克利博(bo)士(shi)Lianmin Zheng和UCSD准教(jiao)授(shou)Hao Zhang創(chuang)立(li)，目標(biao)是通过共同开发开放(fang)的数据集、模型、系统和评估工(gong)具，使每个人都能获得大型模型。

Lianmin Zheng

Lianmin Zheng是加州(zhou)大学伯克利分校(xiao)EECS系的博士生(sheng)，他(ta)的研究興(xing)趣(qu)包(bao)括(kuo)机器学習(xi)系统、编譯(yi)器和分布式系统。

Hao Zhang

Hao Zhang目前是加州大学伯克利分校的博士后研究员。他將(jiang)于2023年(nian)秋(qiu)季(ji)开始在加州大学聖(sheng)地亞(ya)哥(ge)分校Hal?c?o?lu数据科(ke)学研究所和计算机系擔(dan)任助(zhu)理教授。

参考(kao)資(zi)料(liao)：

https://lmsys.org/blog/2023-05-03-arena/返(fan)回搜(sou)狐(hu)，查(zha)看更多

責(ze)任编辑：