漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-06 talkingdev

Anthropic以15亿美元和解作者集体诉讼,AI版权争议迎来里程碑

人工智能公司Anthropic近日同意支付15亿美元,就与图书作者的版权侵权集体诉讼达成和解。这一案件被视为AI训练数据版权争议的标志性事件,涉及生成式AI模型使用受版权保护内容的核心法律问题。和解金额创下同类案件...

Read More
2025-09-04 talkingdev

瑞士发布Apertus开源AI大模型:支持千种语言,仅用公开数据训练

瑞士近日正式推出名为Apertus的开源人工智能大模型,该模型仅使用公开可获取的数据进行训练,支持超过1000种语言,提供80亿和700亿两种参数规格版本。这一举措标志着主权国家首次以独立身份参与全球AI竞争。Apertus...

Read More
2025-08-04 talkingdev

可观测性不仅是SRE的专利:开发者如何快速上手OpenTelemetry

OpenTelemetry(OTel)作为厂商中立的开源框架,通过追踪(traces)、指标(metrics)和日志(logs)三大核心信号,为应用程序行为提供全景式监控方案。其标准化数据采集能力正成为云原生时代的技术基础设施,尤其在...

Read More
2025-07-02 talkingdev

Cloudflare推出付费爬取市场:网站可向AI机器人收取内容抓取费用

Cloudflare近日推出名为'Pay per Crawl'的创新市场平台,该平台允许网站所有者对抓取其内容的AI机器人收费。这一举措标志着网络内容产权保护进入新阶段,通过技术手段为原创内容提供者创造直接收益渠道。平台采用智...

Read More
2024-10-16 talkingdev

CapibaraZero:基于ESP32-S3的经济型FlipperZero替代品

CapibaraZero是一款基于ESP32-S3的设备,作为FlipperZero的经济型替代品,旨在为用户提供高性价比的功能。该设备采用了强大的处理器,支持多种无线通信协议,能够实现多种应用,包括无线调试、设备控制和数据采集等...

Read More
2024-07-16 talkingdev

Crawlee:大规模的网络数据采集工具开源

Crawlee是一个全新的工具包,基于多款爬取软件构建,旨在帮助用户大规模地收集网络数据。无论是企业还是个人,都可以通过使用Crawlee来优化和简化网络信息的获取过程。这个工具包将多种爬取软件的优点结合起来,提供...

Read More
2024-04-08 talkingdev

科技巨头如何为AI采集数据走捷径

近期,科技巨头们在人工智能领域领跑的比赛中采取了一些颇具争议性的数据获取方式。OpenAI通过开发名为Whisper的语音识别工具,成功从YouTube视频中转录音频,为训练其AI系统提供了新文本。该团队最终转录了超过一百...

Read More
2023-08-02 talkingdev

论文:自动音乐字幕系统取得显著成绩

为音乐产生人类可读的描述对于大多数系统来说都是一项挑战,甚至对于人类来说也相当困难!然而,凭借一些巧妙的数据采集和标签技术,研究人员成功地收集了一个涵盖各种音乐流派的2.2m字幕数据集。他们在此数据集上训...

Read More