AI文摘

blog-thum
一些RLHF的平替汇总

众所周知,RLHF十分玄学且令人望而却步。我听过有的小道消息说提升很大,也有小道消息说效果不明显,究其根本还是系统链路太长自由度太高,不像SFT一样可以通过数据配比、prompt、有限的超参数来可控地

read more
blog-thum
用中国互联网的方式打开OpenAI大戏

OpenAI与SamAltman这场反转反转再反转的大戏 还有谁没吃上瓜!本剧多次喜提热搜赢N次 全球群众吃瓜共此时湾区人民熬夜指数直线飙升还好,在感恩节前夕!这场闹剧终于大团圆落幕啦!以下是这些

read more