Home云端城市Amazon预览图像生成模型、新增文字生成模型

Amazon预览图像生成模型、新增文字生成模型

Author

Date

Category

AWS

Amazon周四在re: Invent大会上公布AWS生成式AI模型产品,包括第一个图像生成式模型Titan Image Generator,以及文字生成模型Amazon Titan Text Express及Titan Text Lite。

新公布的模型中,Titan Image Generator为Amazon自行开发的Titan家族最新模型之一,使其得以赶上OpenAI、Google、微软等竞争者,具备图片编辑及加入浮水印等功能。Titan Text Express及Titan Text Lite则是AI模型平台Bedrock的新增文字模型。在Bedrock服务平台上,用户可以透过Bedrock控制台直接存取使用,或是以自有资料再加以客制化训练。

Amazon Titan Image Generator允许用户以英文自然语言输入提示视窗,以建立专业等级的图像,作为广告、电商平台,或是媒体与娱乐内容。Amazon表示,这项服务是以高品质而多元化的资料训练而成,可生成精准、贴近真实、少扭曲,且属性多元的图片,并能理解包含多个物件的复杂提示。

Titan Image Generator的图片编辑功能之一,是利用内建分割模型自动编辑图片。最新模型支援以图片遮罩进行修补(inpainting)及以扩展(outpainting)延伸或变更图片背景。使用者可设定图片大小、指明想要模型产生几种款式。用户也可利用其自有资料客制化模型,以生成和公司品牌指引一致的图片,或是透过微调令模型生成特定风格的图像。它也支援负责任AI原则,防止生成有害或恶意的图片。

此外,有鉴於这模型可被用於生成Deepfake影像,所有以Titan生成的图片都会加入看不见的浮水印,以利辨识AI生成的图片。不过Amazon并未说明技术资讯。《The Verge》引述AWS主管指出,这浮水印不会破坏图片画质,也无法被裁切或压缩掉,但使用者需要连结到独立API以判别是否为AI生成。

AWS还为Bedrock新增了2个Titan文字生成模型Titan Text Express及Text Lite。Titan Text Express为「价格和效能兼顾」的文字生成模型,提供最多8000 token输入,也可以微调。它支援的情境包含检索增加生成(retrieval-augmented generation)、开放式文本生成、脑力激荡、摘录重点、程式码及表格生成、文本改写、改述(paraphrasing)、关联思考(chain of thought)、撷取、问答及聊天等。

而Text Lite版则是为特定使用场景而设计,强调「具成本效益且可高度客制化」的LLM。Lite版最大输入为4000 token,支援场景包括摘录重点及文案写作(copywriting)。

Titan Text Express目前已正式推出英文版,并有100多个语言版本已以预览版上线,Titan Lite则仅支援英文。

除了主打的图片生成模型外,AWS昨日还推出Titan多模嵌入(Titan Multimodal Embedding)模型。此一模型可支援多模态提示输入,包括文字、图片或者两者同时输入。Titan多模嵌入模型支援输入最高128 token及25MB图片,仅支援英文。

Titan多模嵌入提供非同步批次API,Amazon OpenSearch Service的神经搜寻(Neural Search)很快也会加入连接器,以便加入Titan多模嵌入模型支援。

黑豹vp怎么样

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论

Linda Barbara

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum imperdiet massa at dignissim gravida. Vivamus vestibulum odio eget eros accumsan, ut dignissim sapien gravida. Vivamus eu sem vitae dui.

Recent posts

Recent comments

0
希望看到您的想法,请您发表评论x