公测福利

申请通过的客户可享受

公测期间全免费
贴身1对1技术专家支持
OpenSearch算法平台
将日常繁杂的搜索算法工作抽象成通用流程,内置阿里集团多年经验积累的经典搜索算法,通过简单低门槛的可视化界面为用户提供一站式全链路
的高质量搜索算法解决方案。功能正式于4月初开放公测,现可以报名登记,公测期间免费体验!
核心优势
1.简单可视化,无需理解复杂的算法逻辑,从未做过算法也可使用。
2.可定制可迭代,告别全黑盒封闭的状态,用户可参与各个环节的定制。
3.全流程实现,从原始数据采集到模型训练到模型评估以及最后的部署上线。
4.经过集团内业务实践的经典排序算法功能集成,助力效果快速达到预期。
功能一:模型创建
算法平台一期邀测期间优先开放淘宝搜索经典排序模型——人气模型
核心环节可定制
1.数据集信息,即原始数据预处理环节,一期在行为数据字段基础之上支持增加opensearch应用中的属性字段,比如评论数、收藏量等。另外在这个环节,目前支持简单的预处理规则定义,比如空值填充等。
2.特征工程,对训练数据集中的所有字段映射和组合形成特征后的特征变化规则的制定。一期开放归一化、离散化和标准化的处理。
3.算法配置,一期可选算法限定LR(逻辑回归),支持正则化类型、收敛误差、最大迭代次数等参数的自定义。
人气模型介绍
人气模型是什么?
人气模型是淘宝搜索最基础的排序算法模型,其量化每个商品的静态质量及受欢迎的程度的值称之为商品人气分。该模型对很多搜索场景具有普适性,在非商品搜索场景中通过人气模型也可以计算出doc的受欢迎程度。(离线计算类模型)
哪些特征参与训练?
实体维度:商品/doc、品牌、商家、叶子类目、一级类目等。
时间维度:1天、3天、7天、14天、30天、时间衰减加权等。
行为维度:曝光、点击、收藏、加购、购买、评论、点赞等。
统计维度:数量、人数、频率、点击率、转化率等。

功能二:模型评估

提供算法领域专业的模型评估指标分析,全方位衡量模型的效果

专业的评估报告

Area Under Curve,ROC曲线下与坐标轴围成的面积,通常在0.5-1之间,数值越大效果越好。AUC值:

(receiver operating characteristic curve)根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。ROC曲线:

每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。混淆矩阵:

每个特征对于模型的效果产生的实际的影响量化值。特征权重:

功能三:模型部署和应用
一键部署上线,快速高效应用在业务中
灵活应用到业务
1.应用在粗排表达式,部署需要索引重建后才可生效。生效后在粗排和精排表达式中均可使用模型参与排序。
2.应用在精排表达式,部署即时生效,不需索引重建。生效后只能在精排表达式中使用。
功能四:AB Test
通过流量切分实验模型上线后对业务的效果,降低试错成本,助力业务快速迭代
端到端的可视化流程
1.支持多场景多分组下流量划分进行实验,充分满足单一应用但覆盖多样业务场景的实验需求。
2.实验配置和上下线状态灵活可调整,即操作即生效
3.报表天级产出。
4.全流程可视化界面操作,快速接入,简单无门槛,产品和运营人员可自行使用,解放技术精力。

算法平台接入流程

接入算法平台的前提需要在OpenSearch开通行为采集服务,开通后即可通过sdk在server端向OpenSearch推送行为数据,为了效果保证建议数据至少推送2天以上再进行后续算法平台的使用。

行为数据推送到OpenSearch后,即可通过控制台进入算法平台中创建模型。模型创建包括数据预处理规则、特征工程以及算法参数的定义。完成以上配置后即可触发模型训练,待模型训练完成后会产出模型的评估报告和训练样本数据的字段统计图表。根据评估报告和样本数据的统计结论,决定模型继续迭代还是部署到OpenSearch应用。

部署完成后即可在应用的粗排和精排表达式中使用训练好的模型。

行为数据采集详细文档

接入算法平台的前提需要在OpenSearch开通行为采集服务,开通后即可通过sdk在server端向OpenSearch推送行为数据,为了效果保证建议数据至少推送2天以上再进行后续算法平台的使用。

行为数据推送到OpenSearch后,即可通过控制台进入算法平台中创建模型。模型创建包括数据预处理规则、特征工程以及算法参数的定义。完成以上配置后即可触发模型训练,待模型训练完成后会产出模型的评估报告和训练样本数据的字段统计图表。根据评估报告和样本数据的统计结论,决定模型继续迭代还是部署到OpenSearch应用。

部署完成后即可在应用的粗排和精排表达式中使用训练好的模型。

公测报名