hetun 发布的文章

本月月初,适逢端午节假期,拼拼凑凑 合成了五天左右的假期,在长三角几个知名的旅游城市逛了一圈。从苏州--上海--扬州--扬州高邮,一圈游荡下来。(本博文撰写的时候,时间已经过去将近半个月,迫于我的拖拖拉拉,好多细节已经丢失)从小马出发,背着四十来斤的摄影包,跋涉到苏州,住在某个公寓民宿中,抓紧...本月月初,适逢端午节假期,拼拼凑凑 合成了五天左右的假期,在长三角几个知名的旅游城市逛了一圈。从苏州--上海--扬州--扬州高邮,一圈游荡下来。(本博文撰写的时候,时间已经过去将近半个月,迫于我的拖拖拉拉,好多细节已经丢失)从小马出发,背着四十来斤的摄影包,跋涉到苏州,住在某个公寓民宿中,抓紧把包放...

之前的文章里写过,使用白嫖的无影云,挂一个对接GPT的微信机器人。最近一直在研究模型微调和外挂知识库RAG,并且搜罗了一些相关领域的优秀开源项目。今天就使用其中比较知名的FastGPT对接chatgpt-on-wechat制作一个微信法律问答助手。这是以最新发布的DeepSeek V2作为基座...之前的文章里写过,使用白嫖的无影云,挂一个对接GPT的微信机器人。最近一直在研究模型微调和外挂知识库RAG,并且搜罗了一些相关领域的优秀开源项目。今天就使用其中比较知名的FastGPT对接chatgpt-on-wechat制作一个微信法律问答助手。这是以最新发布的DeepSeek V2作为基座模型,...

今天在群内交流时,受到算想未来赵总的邀请,对其旗下的算想云进行使用。根据其介绍,算想云(https://LLM.sxwl.ai)是 Serverless 大模型训推云服务,目标用户 ML 工程师、MLOps 工程师、AI 应用开发者。用户手册:https://tricorder.feishu....今天在群内交流时,受到算想未来赵总的邀请,对其旗下的算想云进行使用。根据其介绍,算想云(https://LLM.sxwl.ai)是 Serverless 大模型训推云服务,目标用户 ML 工程师、MLOps 工程师、AI 应用开发者。用户手册:https://tricorder.feishu.cn/...

在浅尝过调用gpt对接gpt-wechat机器人,和自行部署vllm+01Ai的大模型后,我们继续尝试用一些好用的工具帮我们快速经行大模型的微调。基础环境还是由老朋友autodl来为我们提供。不多赘述,自行选择GPU和创建环境。进入jupyter lab打开一个终端,git 获取llamafa...在浅尝过调用gpt对接gpt-wechat机器人,和自行部署vllm+01Ai的大模型后,我们继续尝试用一些好用的工具帮我们快速经行大模型的微调。基础环境还是由老朋友autodl来为我们提供。不多赘述,自行选择GPU和创建环境。进入jupyter lab打开一个终端,git 获取llamafacto...

AI训练需要大量的GPU算力,除了大家比较熟悉的autodl、谷歌、亚马逊之外,openbayes也很不错,目前注册送3小时的4090算力,足够我们在上面跑通glm模型流程了。用我的专用邀请链接,注册 OpenBayes,双方各获得【额外】 60 分钟 RTX 4090 使用时长,支持累积,永...AI训练需要大量的GPU算力,除了大家比较熟悉的autodl、谷歌、亚马逊之外,openbayes也很不错,目前注册送3小时的4090算力,足够我们在上面跑通glm模型流程了。用我的专用邀请链接,注册 OpenBayes,双方各获得【额外】 60 分钟 RTX 4090 使用时长,支持累积,永久有效...