五一假期刚过,娱乐圈就像一个巨大的瓜田,一夜之间炸出了7个大瓜,出轨、去世、网暴,各种猛料层出不穷。你一定好奇,这些瓜到底是怎么回事?今天,就让我们一起走进这个热闹非凡的娱乐圈,看看这些大瓜背后的故事。
汪小菲和大S的离婚事件还没平息,他的新婚之路就又遇到了麻烦。汪小菲的未婚妻马筱梅,原本被大家视为幸福的新娘,却突然被爆出婚内出轨的丑闻。马筱梅的前夫郑扬融,在社交媒体上晒出了不起诉处分的法院记录,直指马筱梅在婚姻期间出轨。这突如其来的爆料,让汪小菲和马筱梅的婚期蒙上了一层阴影。
汪小菲一家在互联网上一直很活跃,拥有一大批忠实粉丝。凡是和他们家有关的事情,都逃不过网友的视线。大S当年离婚时,承受了巨大的舆论压力,而郑扬融这次也未能幸免。他原本不想干涉马筱梅的新生活,但面对网络上对他的网暴和抹黑,他终于忍无可忍,选择在汪小菲和马筱梅的婚期前展开反击。
汪小菲和马筱梅对郑扬融的反击并没有做出太大反应,倒是张兰,为了保护马筱梅,火速转发了律师声明。但网友们并不买账,认为她只是在虚张声势。现在,这几个人各执一词,是非对错难辨,汪小菲和马筱梅的婚礼能不能如期举行,还是个未知数。
胖东来超市在河南非常有名,但今年五一,一家名为“胖都来”的超市在浙江开业,却引起了不小的争议。这家超市明显是想碰瓷胖东来,不仅选择在五一这个节假日开业,还请来了一大堆明星助阵,包括三德子赵亮、老戏骨丁勇岱、主持人刘仪伟、美女演员叶璇等。
胖都来的宣传视频一出来,网友们就坐不住了。有人讽刺胖都来老板,说他应该卖雷碧、康帅傅、六个核弹,再请个“周杰轮”代言;还有人抵制助阵明星,跑到他们的评论区下面质问他们为什么要挣这种黑心钱。胖都来的做法,虽然吸引了眼球,但也引发了网友们的强烈不满。
AI圈子最近也发生了一件大事,那就是大名鼎鼎的Chatbot Arena排行榜被指系统性“造假”。一篇名为《The Leaderboard Illusion》的预印本论文横空出世,直接对这个被广泛视为LLM试金石的平台提出了系统性质疑。论文更是直接点名Meta Llama 4刷榜造假”,连大佬Andrej Karpathy都下场发表了看法。
Chatbot Arena由LMSYS创建,通过让用户匿名与两个模型对话并投票选出更好的那个,来对大模型进行排名。因其动态、用户驱动的评估方式,能捕捉到传统基准测试之外的真实用户偏好,迅速成为衡量顶级AI系统能力的事实标准,影响力巨大。
《The Leaderboard Illusion》这篇论文,由Cohere、普林斯顿、斯坦福等机构的研究人员撰写,通过分析大量数据,指出了Chatbot Arena存在的几大核心问题,认为其公平性和可靠性受到了损害。
论文指出,少数大型、专有模型提供商被允许在Chatbot Arena上进行大量私下测试,可以提交多个模型变体进行评估,但最终只选择性地公开表现最好的那个版本的分数,甚至可以撤回不满意的结果。论文点名Meta在Llama 4发布前,仅一个月内就在Arena上测试了多达27个私有变体。这种做法被指扭曲了排名,让这些提供商获得了不公平的优势。
论文还指出,由于私下测试、更高的采样率以及模型下线策略,专有模型提供商获得了远超开源/开放权重模型的用户反馈数据。论文估计,仅Google和OpenAI就分别获得了Arena总数据的19.2%和20.4%,而83个开放权重模型合计仅获得29.7%。这种数据不对称,让优势方更容易针对Arena进行优化。
论文通过实验证明,即使少量Arena数据也能显著提升模型在Arena评估中的表现。这种过拟合现象,让模型的优化效果难以真实反映其在实际应用中的能力。
面对这些指控,Chatbot Arena官方紧急回应,表示会认真对待这些问题,并进行改进。但这场风波,