第291章 联合登月前(求月票!)(1 / 2)
第291章 联合登月前(求月票!)
「在这方面我已经和华为高层沟通过一轮了,他们每年给的40亿,我本来的意思是其中的20亿用他们的计算卡来抵帐。
现在既然华国投资那边会到帐500个亿,那华为每年的40亿全部都用计算卡来抵帐。」
这麽说吧,阿波罗科技面临的是比华为还要更加严重的ZC。
在阿波罗科技打GG的哔哩哔哩都要被赶回香江上市,华为可不至于此。
加上阿波罗科技已经充分展现出了野心和能力。
空有野心很正常,谁都有野心,但你得有实力啊。
阿波罗科技就不一样了,能够把老马逼的提前两年跳反。
本来马斯克还能在驴党的旗帜下苟到2024年年中,再切换阵营。
可见阿波罗科技给马亲王都打出真实伤害了。
对白宫的冷战活化石来说,他宁可放华为去找先进位程代工,都不可能让阿波罗科技能买到英伟达的AI计算卡。
不过还好有华为,华为在2019年的时候就推出了自己的计算卡。
现在是2022年,ChatGPT还没有问世,各家大厂也能买到阉割版的英伟达AI计算卡,华为的升腾属于一个接近于无人问津的状态。
林燃愿意一半的GG费用升腾抵帐,这也是华为答应200亿价格的重要原因之一。
国内顶级的科技公司愿意用他们的升腾计算卡,这对他们的计算卡生态完善也有好处。
至于为什麽不和其他厂商合作,背靠华为的升腾生态尚且是一片空白,其他厂商可想而知。
「其实华为的计算卡和英伟达比起来差距还是挺大的,唉,不过确实没办法,我们现在的情况就是买不到英伟达的计算卡,哪怕阉割版都买不到。」
Pony苦笑,他联想起他办公电脑用的还是Linux作业系统,整个阿波罗科技有专门的桌面支持团队,确保大家能够用Linux用的舒心,他就知道当前面临的是怎样的窘境。
华为方面一直在给阿波罗科技推鸿蒙,说你们用鸿蒙肯定比Linux好用,至于火箭设计仿真软体丶流体力学计算软体等等工业软体在鸿蒙系统上用不了,我们会给你解决。
不过华为在推动这件事,只是他们说解决,暂时都还没看到解决了。
林燃也苦笑:「是的,问题在于,就算英伟达会卖给我们,我也不敢用啊,谁知道会发生什麽。」
林燃随后又振奋道:「不过还好,我和华为那边沟通过,对我们而言,他们的晶片已经够用了。
因为根据元素特性推导材料性质,这类模型的数据量很稀疏,数据丶算力和算法三要素里,对数据和算法的依赖远高于算力。」
Pony对人工智慧也颇为了解,腾讯每年从ai领域挖来的大牛不计其数,哪怕此时ChatGPT还没有横空出世,他希望从林燃这了解更多信息,好为后续开展工作提供方向:「林生,你仔细说说。」
林燃进一步解释道:「这是因为材料科学领域的数据非常非常有限,数据共享也好获取也好都面临着空前的障碍。
不同实验室产出的实验数据除非刊登到论文里,不然各家的数据是不会进同一个池子,当然他们想要进同一个池子,也会有各种各样的担心。
因为你很难保证,所有研究机构提供的数据不会污染资料库。
有人数据造假,就会污染整个数据源。
目前就我了解到的情况,类似研究数据非常稀缺,最多的数据也要少于4000个样本。
特徵工程是AI模型成功的关键,但其设计在材料属性预测中尤为复杂。
物理元素性质,像原子量丶电负性这些和材料结构,像晶格类型丶键长这些,都要转化为数值特徵,提供给模型学习。
其中特徵选择直接影响模型准确性,错误选择可能导致性能下降。
目前整个过程仍然需要依赖研究人员去手动处理特徵值,去做筛查。
非常依赖研究者经验和直觉,极可能遗漏重要信息。
nature去年的子刊他们整出了一个MODNet的学习框架,就是一个材料属性预测的机器学习框架。
(《通过特徵选择和MODNet的联合学习实现有限数据集的材料属性预测》于2021年6月3日刊登在Nature子刊NPJ上)
他们发现要预测材料的振动熵时,反向键长和p价电子是关键特徵,但手动识别这些特徵需深厚领域知识。
这些数据的提取需要有足够丰富经验的科研民工来做,同时还要确保数据的精确,降低误差,整个过程非常繁琐。
因为我们要做的东西远比他们更复杂,我们要做的是一个更大的,更复杂的模型,特徵数据的归纳总结和收集,速度肯定很慢。
毕竟这件事无法像网络空间的数据那样,可以通过特徵值剔除,各种办法来确保数据的准确,它的数据用计算机术语来说,从外表看上去是结构化数据,但内核却非常的不结构化。
因此按照我的估计,至少前五年,前五年华为的计算卡都够用。
至于五年之后,华为的计算卡也会与时俱进,加上我们本身也会和华为合作来推进他们计算卡的进度。」
Pony听完后大致能够理清思路,不说完全听懂,毕竟你想让一个五十岁的人听懂振动熵丶反向键长和p价电子这些东西,那还是太为难Pony了。
但林燃要表达的点,他都理解了。
Pony说道:「林生,我没有反对和华为合作的意思,同样的,我们面临的形势我很清楚,固然有寒武纪丶阿里丶百度这些厂商都有自己的计算卡,但一方面他们的计算卡代工需要依赖台积电,另外一方面在生态上,华为走的最远,从长期来看,他们在长期构建生态这件事上有着最大的决心和能力。
我只是感慨,我们当前面临的局面困难。
林生,我有一个问题,我们是不是应该和一些高校的化学系丶物理系之类的搞横向课题?让他们来帮我们完善我们的数据池?」
此时市面上不止华为有计算卡,Pony提到的哪几家都有在推,但计算卡这玩意不仅仅是看硬体,和硬体配套的软体生态也同样重要。
英伟达为什麽如此强势,AMD不也有在造AI晶片吗?为什麽都是阿美利肯企业,AMD的计算卡威胁不了英伟达?英伟达的护城河在于它常年培养起来围绕着计算卡名为CUDA的生态。
同样,华为有建鸿蒙的决心,在计算卡这个领域,他们就是最好的选择。
加上大家都是阿美利肯的眼中钉肉中刺,大家报团取暖再正常不过。
林燃说:「当然,我有想过,但不是现在。」
阿波罗登月都能薅学生羊毛,在建材料科学人工智慧预测模型这件事上又怎麽可能不利用华国广大的理工科学生呢。
这都是优质的纯天然苦力。
与其帮导师做横向课题,还不如来给阿波罗科技做横向课题,后者好歹真的能改变世界。
「我的想法是等我们什麽时候把整套数据采集方案确定了,然后再以申海交大为试点往外扩张。
要建这玩意,是肯定要依赖国内高校的力量,这也是我们的优势。
前面不是提到过数据难以采集吗?有了规则之后,无论是采集的标准化程度,还是说对脏数据的剔除,都有了方法可依。
那个时候才是国内高校大规模参与的时候。
这麽说吧,这套材料领域的人工智慧工业软体将会是我们最大的护城河。
Pony,你这麽想,如果元宇宙有一天真的能够成为现实,虚拟实境真的能够让人有和现实一样的体验,现在只能构建动画效果的物理引擎肯定是不够的。
而我们的这套工业软体内核,会是未来元宇宙的构成根基。
不过这个有点太远了。
短期,我说的短期是本世纪,我们的护城河就是材料领域人工智慧工业软体,我把它称之为伏羲平台,第二个是围绕着航天领域一系列我们自研的工业软体,我们会在现有开源的基础上打造自己的生态,第三个就是数据,你也看到了,我们现在要实现月球着陆和喝汤一样简单。
一步快步步快,月球表面数据丶地月之间往来数据丶月球各个地域陨石概率丶月球风貌等等,这些数据也会是我们的护城河。
第一个去月球,我们也会第一个去火星,第一个把我们的足迹遍布整个太阳系。
工业软体生态丶太空相关数据丶伏羲平台,这三者就是我们实现目标的手段。
↑返回顶部↑