-月光博客

2023年12月9日星期六

谷歌承认Gemini演示视频是剪辑版

科技巨头谷歌的新大模型Gemini一夜爆红，受到市场看好，但有分析指出，谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。

当地时间12月6日，谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型，被应用于谷歌Pixel 8 Pro智能手机和聊天机器人Bard。Gemini被视为对于AI（人工智能）新锐巨头OpenAI旗下最新大模型GPT-4的直接回应，也象征着一度因聊天机器人ChatGPT而处于被动状态的谷歌终于正式冲回赛道。

据谷歌介绍，Gemini在MMLU（大规模多任务语言理解）的得分率达到90.0%，是第一个在MMLU测试中超过人类专家的模型。Gemini将包括一套三种不同规模的模型，其中，Gemini Ultra被定位为GPT-4的竞争对手，Gemini Pro的性能优于GPT-3.5，Gemini Nano则用于特定任务和移动设备。

凭借强大的性能，Gemini一夜爆红，引来了华尔街的关注。12月7日，谷歌母公司Alphabet（Nasdaq：GOOG）的股价涨5.31%，收于136.93美元，迎来自今年8月29日以来表现最好的一天，总市值达到1.72万亿美元。

美国银行的分析师在6日指出，由于人们对于谷歌的AI能力感到担忧，Alphabet今年承受了一定的压力，而一款“具有良好品牌形象的、竞争力较强的模型”可能会吸引更多消费者使用谷歌搜索，并对云服务的销售产生积极影响：“数据显示谷歌拥有一流的、不可复制的AI能力，这可能对公司在2024年上半年的股票走势产生积极影响。”

摩根大通的分析师在6日的一份报告中写道，尽管市场在当天没有对Gemini给出明显的反应，能够看到谷歌在“这一主要技术转变”中的进展还是十分“鼓舞人心”。然而，摩根大通也指出，大模型在“搜索领域的货币化路径存在不确定性”，可能会在未来带来一些阻力。

在7日的报告中，摩根大通的分析师写道：“虽然现在还处于其发展早期，但Gemini的推出象征着在生成式AI获得广泛商业化并得到广泛传播的第二年中，谷歌做出了重大创新。”

目前看来，谷歌如何在整体业务、尤其是最重要的搜索业务中将Gemini进行商业化是备受华尔街关注的一点。目前，谷歌计划在本月晚些时间通过谷歌云将Gemini授权给客户，并将在未来几个月与谷歌服务中的其他产品集成，但还没有公布后续的商业化策略。

富国银行（Wells Fargo）的分析师表示，Gemini的推出应该足以平息关于“谷歌在AI领域究竟应该何去何从”的争论，不过，关键问题在于谷歌如何利用Gemini获得营利：“简而言之，我认为谷歌证明了他们仍然具有一些竞争力。”

而KeyBanc的分析师也表示，Gemini是谷歌今年众多AI公告的“顶峰”，但要让AI对谷歌的业绩增长和盈利能力产生积极影响需要时间：“Gemini仍在努力进入搜索等核心产品，因此我们建议耐心观察其影响。”

不同于华尔街的整体看好，在科技领域中有声音指出，Gemini或许存在“夸大宣传”的质疑。

在Gemini于6日推出后不久，就有网友指出了宣传资料中的一些不妥之处。例如，当谷歌称Gemini的MMLU的得分率高于GPT-4时，显示GPT-4的得分率是86.4%，但根据谷歌发布的60页技术报告，Gemini Ultra的MMLU测试结果下有“CoT@32”的小字注释，表示其使用了思维链提示技巧，尝试了32次并从中选择最好结果。而作为对比的GPT-4却是无提示词技巧给5个示例，在这个标准下，Gemini Ultra的测试结果其实是83.7%，低于GPT-4的86.4%。

如果是同样使用CoT@32的方法，虽然成绩仍低于Gemini Ultra，GPT-4的得分率达到了87.29%。

如果像谷歌DeepMind首席科学家杰夫·迪恩（Jeff Dean）回应的那样，这种写法只是为了显示两种不同方法间的比较，对于Gemini测试视频的质疑则显得更加难以反驳。

在推出Gemini后，谷歌发布了一个时长六分钟的演示视频，展现了测试员和Gemini的一些有趣互动，其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中，Gemini的反应速度都非常快，还会生成音频和图片来辅助回答，并用上一些口语化乃至幽默化的表达，可谓是让人大开眼界。

然而，很快就有网友从视频开篇的文字免责声明中发现了问题，认为其可能暗示了视频中展示的是精心挑选的好结果，不是实时录制，而经过剪辑的。随后，谷歌在一篇博客文章中解释了多模态交互过程，基本上也间接承认了只有使用静态图片和多段提示词拼凑，才能达成演示视频中的效果。

例如，在文章中，谷歌承认，不同于视频中对于猜拳手势的快速反应，只有在向Gemini同时展示这三个手势并提示其这是游戏时，Gemini才会得出猜拳游戏的结论。

有分析指出，这和谷歌在视频中所暗示的可以说是完全不同，因为从视频看来，Gemini可以实时观察周围的世界并做出反应，用户可以与Gemini进行流畅的语音对话。沃顿商学院教授伊桑·莫利克（Ethan Mollick）也在X平台上进行了演示，如果是使用静态图片和多段提示词，完全可以通过ChatGPT Plus来复制Gemini的表现。

伊桑·莫利克给ChatGPT Plus同时展示谷歌演示视频中的多张截图，ChatGPT Plus也能给出类似的答案。

在质疑发酵后，谷歌DeepMind产品副总裁伊莱·柯林斯（Eli Collins）对外媒回应称，视频中的画鸭子演示（画一个鸭子的简笔画，Gemini可以对每一步骤做出正确的解释）确实是研究级别的功能，至少目前还没有出现在谷歌的实际产品中。

谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯（Oriol Vinyals）也在X（原推特）平台上发布长文，解释了团队是如何制作该视频的：“视频中的所有用户提示和输出都是真实的，只是为了简洁而进行了缩短。”维尼亚尔斯还表示：“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。”

然而，维尼亚尔斯的回应引发了更多的争议。有网友评论道：“如果你想激励开发者，为什么不发布真实的内容呢？被缩短的用户提示就不算‘真实’。这样做既不真诚，又具有误导性。”

有谷歌员工对外媒透露，他们认为这段视频描绘了一幅“不切实际的画面”。有员工表示，对这种夸张的演示并不感到惊讶，因为员工们已经习惯了公司会对产品在某种程度上进行夸大营销：“我认为大多数使用过大语言模型技术的员工都知道，要对（演示中的）这一切持保留态度。”

有外媒认为，谷歌“庞大的官僚体系和各级产品经理使其直到现在都无法像OpenAI那样敏捷地推出产品”。对于正在应对AI转型影响的社会而言，这并不是坏事。但对于谷歌最近这种迅速推进的表现，应该保持一定的保留态度。

来源：澎湃新闻

谷歌发布最新人工智能模型Gemini

谷歌公司6日宣布推出一种名为Gemini的新人工智能模型，声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。

Gemini已针对不同的应用创建了3个版本，分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。

其最小版本Nano旨在在智能手机上运行，实际上有两种模型：一种用于速度较慢的手机，拥有18亿个参数；另一种用于功能更强大的手机，拥有32.5亿个参数。据传GPT-4包含多达1.7万亿个参数，而Meta的LLAMA-2则包含700亿个参数。

谷歌声称，Gemini的中档Pro版本击败了其他一些模型，例如OpenAI的GPT3.5，但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%，而“专家级”的人类预计能达到89.8%。

这是人工智能首次在测试中击败人类，也是现有模型中得分最高的。该测试涉及一系列棘手的问题，主题包括逻辑谬误、日常场景中的道德问题、医疗问题、经济和地理。

在同一测试中，GPT-4的得分为87%，LLAMA-2的得分为68%，Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。

去年，谷歌“深度思维”发布了一款名为AlphaCode的人工智能代码生成器，它可击败50%的人类开发人员，而新发布的Gemini声称可击败85%的人类编程师。

谷歌“深度思维”的艾力·柯林斯表示，Gemini“几乎在每个领域都是最先进的”。

Gemini目前没有可供测试的版本，但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼：我现在就需要它！而对业内人士来说，这个AI更值得注意之处，是它不仅能力最强，还最通用，这意味着它可以适应各种任务。与当前许多专注于文本的模型不同，Gemini接受过文本、图像和声音方面的综合训练，能接受所有这些格式的输入然后再输出，甚至，它还比所有“前辈”模型们更擅长搞开发。

来源：科技日报

2023年12月5日星期二

苹果新专利可监测心脏负荷

据天眼查，12月5日，苹果公司申请的“心脏监测和管理系统”专利公布。摘要显示，该专利涉及用于确定用户的心脏负荷的系统和方法。

根据专利摘要，这项技术涉及一种用于确定用户心脏负荷的系统和方法。该方法包括使用一个或多个传感器在第一组时间点收集一系列心脏测量结果，确定一组测量数据点；生成与不同于第一组时间点的第二组时间点相关联的一组附加数据点；使用测量数据点和附加数据点来确定预定义时间段的心脏负荷值并输出。

这并非苹果首次在健康监测技术领域取得专利成果。此前，苹果成功获得了一项全新的健康相关技术专利。这项专利有望利用iPhone和Apple Watch对佩戴者的呼吸系统进行分析，进一步丰富和提升苹果的智能健康监测设备功能。

苹果在专利文件中表示，它主要是通过分析和测量用户的呼吸功能，以便及早发现并监控那些可能患有慢性阻塞性肺病（COPD）、哮喘或其他气道相关疾病的人群。相比现有方法，苹果的新专利提供了一种更为简便和可靠的呼吸监测方法。

这些新的专利显示，苹果正在积极研发和应用新的技术，以提升其设备的健康管理功能。这不仅有助于提高用户的生活质量，也可能为苹果在全球健康科技市场中赢得更大的竞争优势。

来源：综合经济网、手机中国

调查显示95%的主播月收入低于5000元

首都经济贸易大学副教授张成刚在《有识》栏目中表示：据该校发布的《新就业形态劳动者的工资保障研究》显示，基于6.3万名骑手的调研数据显示，他们的工资平均约为5000元。与此同时，《中国网络表演（直播与短视频）行业发展报告（2022-2023）》中也透露，在以直播为主要收入来源的主播中，月收入5000元以下占比95.2%。

这也是网友热议“95%主播收入不如外卖员”说法的来源。

不过，不同地区的主播收入也有差异，例如，某直辖市劳动力调查数据显示，网络直播的平均月收入是6709.3元，但同样低于物流服务的7164.2元。

此外，主播行业并非人人都能拿到高薪，和其他行业一样，只有金字塔顶端的极少部分人，能分得最大的利益资源。

直播与短视频行业发展报告中指出，截至2022年末，我国主播账号累计开通超1.5亿个，其中日均新增主播峰值为4.3万人，除了95.2%的主播月收入为5000元以下外，仅0.4%主播月收入为10万元以上。

此前也另有报道称，作为直播中电商直接参与的类别，直播带货行业的马太效应异常鲜明，2.2%的头部主播占据近八成的带货份额。

直播带货的主要玩家，是那些自带流量的人，他们不是因为带货而红，而是因为红了才带货，他们也分走了带货行业最大的利益蛋糕。

对于一名普通人入行主播而言，本人只是扮演“流水线”中一个角色，收益和其它行业并不会差距太多。

稿源：cnbeta

2023年12月1日星期五

中国电商第一股易主，拼多多市值超越阿里巴巴

美东时间周四，阿里巴巴的收盘市值遭拼多多赶超，失去中国电商巨头的第一把交椅。福无双至祸不单行，就在同一天，华尔街投行罕见地下调了阿里巴巴的评级。

阿里惨遭大摩下调评级

美东时间周四，摩根士丹利将阿里巴巴ADR评级从“增持”下调至“持股观望”，目标价从110美元下调至90美元。这是自6月底以来，阿里巴巴ADR首次被下调评级。

摩根士丹利Eddy Wang等分析师在报告中写道，阿里巴巴的复苏速度慢于预期，其暂停阿里云业务分拆的决定“给重组带来的价值释放带来了不确定性”。

摩根士丹利还将阿里巴巴从其A股/港股关注名单中删除，代之以在A股上市的中国铝业。

总体上来看，华尔街目前仍基本看好阿里巴巴，其ADR有44个买入评级，8个持有评级。

拼多多正式登顶中国电商巨头

与此同时，摩根士丹利将拼多多列为中国电子商务领域的首选，认为在消费者对价格日益敏感的背景下，该公司“处于最佳位置”。

拼多多最新公布的第三季度业绩报告显示，公司实现营业收入688.4亿元，同比增长93.9%，旗下跨境电商平台Temu的销售额已经突破50亿美元，尤其是9月，其上线一周年之际，单日GMV甚至达到8000万美元。

在这一超强财报的提振下，拼多多股价连涨三日，推动公司市值首次超过阿里巴巴，正式成为中国电商巨头之首，也成为中概股市值第一股。

截至周四收盘，拼多多收涨4.03%，报147.44美元/股，市值为1959亿美元，首次超过阿里巴巴，后者收盘时市值为1907亿美元。

今年年初至今，阿里巴巴在美国股市下跌了约15%，而拼多多则飙升了80%以上。

来源：财联社

2023年11月30日星期四

我看拼多多市值超越阿里巴巴

昨天，拼多多美股市值盘中短暂超过阿里巴巴，没想到阿里巴巴竟然已经沦落到和拼多多竞争市值的地步了，实在是可悲啊，一个头部企业做成这样，实在没法向广大股东们交代。

11月29日晚间，美股拼多多（PDD）开盘后涨超4%，市值达到1920亿美元，一度超越阿里巴巴（BABA），成为美股市值最大中概股。截至当天收盘，拼多多股价涨幅收窄，现涨1.96%，总市值1883亿美元，低于阿里巴巴的1902亿美元。

值得注意的是，三年前，阿里巴巴市值8600亿美元，拼多多市值1080亿美元，京东市值1200亿美元。

从股价上看，从2021年以来，阿里巴巴、京东等中概股都走上了股价不断下跌的道路，拼多多在2021年也是一样的下跌趋势，然而从2022年开始，拼多多却反其道而行之，走上了股价上升的道路。

那么，2022年到底发生了什么呢？

拼多多的成功肯定不再是所谓“消费降级”了，低端的生意肯定撑不起这么大的市值，2022年，拼多多做了阿里巴巴没做的事情，那就是进军北美市场。

拼多多的美国版Temu于2022年9月1日推出，上线仅一周便冲进了美国购物应用的第14名，10月18日，Temu超越Amazon Shopping登顶美国App Store免费购物应用榜单第一。2022年底，该APP就成为了全美下载量最多的应用程序。

2023年2月，Temu在加拿大上线，并在同月超级碗期间播放了广告，2023年3月，Temu进军澳大利亚和新西兰市场，此后一个月，Temu又相继进入法国、德国、爱尔兰、意大利、荷兰、西班牙和英国市场。

当拼多多不断高歌猛进占领国际市场的时候，阿里巴巴在做什么呢？什么都没做，还是固步自封，在国内市场里瞎折腾，到现在，连股价都要被拼多多超越的时候，阿里巴巴的管理层居然还是沉默不语，无动于衷，实在是可悲可叹。

拼多多美股市值盘中短暂超过阿里巴巴

值得注意的是，三年前，阿里巴巴市值8600亿美元、拼多多市值1080亿美元。京东市值1200亿美元。

“我们这个团队可能和阿里团队差了20年。”2016年3月，拼多多创始人黄峥在其个人公众号上讲述了他的创业梦想，“我们也许有机会在新的流量分布形势，新的用户交互形式和新的国际化的情况下，能够做出一个不一样的阿里。”

彼时，阿里是难以被挑战的庞然大物，市值接近2300亿美元，而拼多多的用户量才刚刚突破1亿。

“当然这句话可能当前看起来有点太大了，但是一步一步走过去，也不见得没有机会。”黄峥曾经写下的话像预言般被验证，在众人的惊讶中逐渐成真。

尽管已经用高速增长给予市场多次惊喜，拼多多在2023年11月28日发布的三季报还是远远超出市场预期：同比增长93.9%的营收、22.6%的净利润率，让拼多多股价暴涨超20%。

或许是感受到了后来者施加的压力，11月29日，针对阿里员工对于前一晚拼多多财报和电商等的讨论，马云在阿里内网罕见地参与了谈论并发言称：“我坚信阿里会变，阿里会改”。

来源：每日经济新闻