当前位置: 首页 > news >正文

深圳网站建设那家好手机网站设计建设

深圳网站建设那家好,手机网站设计建设,简单的crm客户管理系统,公司网站文化活动备案动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3动手学习RAG:迟交互模型colbert微调实践 bge-m3动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct动手学…
  • 动手学习RAG: 向量模型
  • 动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习
  • 动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3
  • 动手学习RAG:迟交互模型colbert微调实践 bge-m3
  • 动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct
  • 动手学习RAG:大模型重排模型 bge-reranker-v2-gemma微调

在这里插入图片描述

1. 环境准备

pip install transformers
pip install open-retrievals
  • 注意安装时是pip install open-retrievals,但调用时只需要import retrievals
  • 欢迎关注最新的更新 https://github.com/LongxingTan/open-retrievals

2. 使用大模型做重排

from retrievals import LLMRankermodel_name = 'BAAI/bge-reranker-v2-gemma'
model = LLMRanker.from_pretrained(model_name,causal_lm=True,use_fp16=True,)score = model.compute_score(['query', 'passage'])
print(score)scores = model.compute_score([['what is panda?', 'hi'], ['what is panda?', 'The giant panda (Ailuropoda melanoleuca), sometimes called a panda bear or simply panda, is a bear species endemic to China.']])
print(scores)

请添加图片描述

3. 微调

MODEL_NAME='BAAI/bge-reranker-v2-gemma'
TRAIN_DATA="/root/kag101/src/open-retrievals/t2/t2_ranking.jsonl"
OUTPUT_DIR="/root/kag101/src/open-retrievals/t2/ft_out"torchrun --nproc_per_node 1 \-m retrievals.pipelines.rerank \--output_dir ${OUTPUT_DIR} \--overwrite_output_dir \--model_name_or_path $MODEL_NAME \--model_type llm \--causal_lm True \--use_lora True \--data_name_or_path $TRAIN_DATA \--task_prompt "Given a query A and a passage B, determine whether the passage contains an answer to the query by providing a prediction of either 'Yes' or 'No'." \--query_instruction "A: " \--document_instruction 'B: ' \--positive_key positive \--negative_key negative \--learning_rate 2e-4 \--num_train_epochs 3 \--per_device_train_batch_size 4 \--gradient_accumulation_steps 16 \--dataloader_drop_last True \--max_len 256 \--train_group_size 4 \--logging_steps 10 \--save_steps 20000 \--save_total_limit 1 \--bf16

请添加图片描述

4. 评测

在C-MTEB中进行评测。微调前保留10%的数据集作为测试集验证

微调前的指标:
请添加图片描述

微调后的指标:

请添加图片描述

{"dataset_revision": null,"mteb_dataset_name": "CustomReranking","mteb_version": "1.1.1","test": {"evaluation_time": 77.35,"map": 0.7057362287508586,"mrr": 0.8166538440773136}
}

微调后map从0.637上升至0.706,mrr从0.734上升至0.816

http://www.yayakq.cn/news/618510/

相关文章:

  • 国外公共空间设计网站网站备案资质
  • 能被百度收录的建站网站思而忧网站
  • 苏州网站搜索引擎优化wordpress 自定义登陆
  • 手机自助网站建设营销组合策略
  • 外贸网站首页国外社交网站做的比较好的是
  • 有没类似建设通的免费网站做网站建设的销售怎么样
  • 杭州网站建设长春公司广州房地产网站建设
  • 工会网站升级改造建设方案焦作网站建设哪家公司好
  • 免费做网站网站的软件有哪些做企业点评的网站
  • 郑州电商网站建设教育培训机构网站模板
  • 法律建设网站数据库网站 建设费用
  • 自己ip做网站做网站费用滁州
  • 网站快速收录教程如何做网站快捷键的元素
  • 设计医院网站建设edge网页视频怎么下载
  • 给企业做网站 内容需要对方提供40个创意包装盒设计
  • 毕业设计网站前端代做成都住建局官网登陆
  • dedecms导航网站电子工程网络工程属于安防工程吗
  • 网站管理后台登录地址怎么买域名自己做网站
  • 月嫂网站建设生猪期货交易平台 app
  • 凡科建站官网页更换视频国外 设计网站
  • 十五款夜间禁用app免费ios镇江网站排名优化
  • 备案做电影网站吗优化外贸网站
  • 网络网站建设价格胡芦娃app软件下载网站
  • 台州免费自助建站模板数据库网站制作
  • 备案网站简介怎么写服装网站建设公司好吗
  • 个人能否做网站郴州网红打卡地有哪些
  • 网站登录页面模板下载东莞广告公司有哪些
  • 三网合一网站建设全包费用微信怎么弄小程序卖东西
  • apsx做的网站怎么发布国内虚拟助手网站
  • 建网站为什么要租空间做微商的网站