【8.4.2】2009--Amunix--XTEN

February 13, 2020 protein 阅读量：次

extended recombinant polypeptides (XTENs)

增加蛋白质治疗剂的体内停留时间可能会降低其给药频率。我们表明，将864个氨基酸的非结构化重组多肽（称为XTEN）与肽或蛋白质的遗传融合提供了延长血浆半衰期的显然通用的方法。异速生长定标表明，XTEN与艾塞那肽的融合体应将艾塞那肽在人体内的半衰期从2.4小时延长至预计的139小时。我们证实了艾塞那肽（exenatide）-XTEN融合蛋白在小鼠中的生物活性。由于延长的稳定性在某些情况下可能会加剧不良副作用，因此我们证明了截短XTEN序列可以调节血浆半衰期。 XTEN缺少疏水性氨基酸残基，这些残基通常有助于免疫原性并使制造过程复杂化。根据有关XTEN与艾塞那肽，胰高血糖素（glucagon），GFP和人类生长激素融合的数据，我们期望XTEN能够以高达每月的间隔向人类中每月快速定量注射否则清除的蛋白药物

除抗体外，大多数人类蛋白质通常通过肾脏过滤（renal filtration）迅速从循环中清除。在用于增加此类蛋白质体内半衰期的策略中，聚乙二醇（PEG）部分的化学连接（PEG化）是最常见的方法之一。除了增加半衰期，聚乙二醇化有时还通过空间屏蔽结合蛋白降低免疫原性并增加治疗有效载荷的稳定性。但是，

化学共轭过程会增加生产成本并产生复杂的产品混合物。
尽管已经开发了提高结合位点产量和特异性的位点特异性结合策略，但是PEG本身的成本和内在异质性仍然存在问题。
此外，在动物模型中已经观察到PEG化的蛋白引起肾小管空泡化。肾清除的聚乙二醇化蛋白或其代谢产物可能在肾脏中积聚，从而形成干扰正常肾小球滤过的PEG水合物的形成。
此外，可以诱导动物和人类产生针对PEG的抗体

一个简单的多肽链可以形成类似于PEG的延伸构象的观察使我们研究了非结构化的蛋白质序列，是否可能提供稳定其融合蛋白的免疫作用，并可能降低其免疫原性的增量效应。

不仅多肽融合物（图1a）比PEG化能提供更均一的最终产物，
而且在制造过程中避免化学结合，
而且多肽长度可以精确地调节至任何所需的长度以控制血浆半衰期

二、设计思路

在设计可提供最大流体动力学半径以屏蔽其蛋白质有效载荷（payload）的可溶性，化学稳定且主要为非结构化的多肽时，

我们首先排除了疏水氨基酸（F，I，L，M，V，W和Y），这些氨基酸通常有助于紧凑结构和/或蛋白质聚集。疏水氨基酸也是主要的组织相容性复合物（MHC）II类驱动的免疫应答的关键识别特征。
其他氨基酸具有在旨在用于临床用途的分子中不希望的性质。例如，含酰胺的侧链（N，Q）在蛋白质药物的长期存储过程中会发生化学不稳定，
带正电的侧链（H，K，R）会导致与细胞膜的结合。
半胱氨酸残基可引起异质二硫键交联。
以前使用2至5个氨基酸的五肽重复序列工程化非结构化氨基酸序列的尝试已显示出免疫原性和较差的溶解性，而仅使血浆半衰期产生了适度的改善12,13，这意味着需要额外的氨基酸来获得所需的长聚合物属性。基于这些考虑，我们的初始设计专门针对六个氨基酸（A，E，G，P，S和T）。
为了在大肠杆菌中创建遗传稳定，高表达，无结构的多肽，我们生成了一个包含随机序列的非重复性36个氨基酸区段的文库（每个区段包含8％A，12％E，18％G，17％P ，28％的S和17％的T），并从这些独特的片段中筛选出约1,500个表达水平。
迭代连接高表达的片段，并重新筛选以获得最大表达，从而产生片段文库，每个片段包含864个氨基酸。
然后评估五个最高度表达的区段的标准，例如遗传稳定性，溶解性，热稳定性，抗聚集性和污染物概况，包括宿主细胞蛋白，DNA和细菌脂多糖（数据未显示）。
根据这些数据，选择了一个名为XTEN的序列进行进一步研究。

三、试验结果

为了评估XTEN的效用和体内特性，我们选择了艾塞那肽（exenatide）（一种39个氨基酸的肽，其作用与胰高血糖素样肽1类似，目前以Byetta出售）。由于艾塞那肽的体积小且能快速清除肾脏，因此血浆半衰期为2.4小时，每天两次给药以治疗2型糖尿病。由于艾塞那肽具有延长的血浆停留时间的变体在临床试验中显示出改善的功效和降低的给药频率（最多每周一次），因此我们预计将XTEN与艾塞那肽融合会产生具有改善的药代动力学和药效学性质的药物。此外，艾塞那肽的体积小且缺乏二级和三级结构，使其成为研究XTEN生物物理特性的理想有效载荷，而没有来自更复杂有效载荷的混杂因素

我们将864个氨基酸的XTEN序列与编码艾塞那肽的合成基因的3’末端融合，然后在其5’末端与编码由烟草蚀刻病毒分离的热纤梭菌纤维素结合域（CBD）的基因融合（ TEV）蛋白酶位点。设计TEV位点，以便加工去除CBD和TEV序列，从而在最终蛋白质的第一个氨基酸位置产生艾塞那肽的组氨酸。这是艾塞那肽功能所必需的。 CBD-艾塞那肽-XTEN融合蛋白在大肠杆菌细胞质中以高水平（> 8 mg / g湿细胞重）表达，没有检测到包涵体的产生。融合蛋白具有极高的热稳定性：澄清后，加热至75°C的匀浆细胞裂解液10分钟可得到80％的纯蛋白，无可检测的产物损失。在澄清的裂解物中加入TEV蛋白酶可去除> 90％的CBD。三个色谱柱步骤（在线方法）去除了所有残留的未消化物质和其他污染物，从而得到了均匀的制剂（图1b）。 N末端测序（数据未显示）证实，在N末端含有艾塞那肽的加工分子是最终制剂中唯一可检测的物种。该融合蛋白等同于Versartis目前为临床研究开发的VRS-859构建体。为了简单起见，此后简称为E-XTEN

包括绿色荧光蛋白（GFP），胰高血糖素，VII因子和人类生长激素（hGH）在内的其他有效载荷也已与XTEN融合在一起，并进行了类似的纯化。 XTEN序列的独特性质倾向于主导任何融合蛋白的特性，因此允许可溶性表达并赋予许多蛋白热稳定性。 CBD-TEV系统虽然不是通用表达所必需的，但已用于生成其他需要天然N端氨基酸的有效载荷融合，例如下文所述的胰高血糖素-XTEN

我们首先对E-XTEN制剂进行了表征，以评估其在体内和临床应用中的适用性，并确认该分子具有预期的物理特性（图1c-e）。通过酶联免疫吸附测定（ELISA）的测量表明宿主细胞蛋白为5 p.p.m。 OD260测定表明宿主细胞DNA低于检测限（<1 ng / mg蛋白）。残留细菌内毒素极低（0.05内毒素单位/ mg蛋白）。浓缩至58 mg / ml时，蛋白质溶液的粘度为23 cP，没有可观察到的聚集或沉淀。因此，融合蛋白应适合通过细针（27-31号）注射以进行皮下给药。

纯化蛋白的圆二色光谱在200 nm处显示出一个最小值，这是未折叠蛋白的特征，没有二级结构的证据（图1c）。质谱分析（图1d）显示了一个预期大小的主要物种（83,591 amu量度与83,580 amu量度）。由于单电荷质量峰的半峰宽小于总质量的1％，因此该物质相对均匀。相比之下，由于PEG制剂的异质性，化学PEG化蛋白质的质谱通常会产生相当宽的峰（半峰宽度> 10％）17。尺寸排阻色谱法表明该蛋白具有较大的流体动力学半径，其洗脱时间比475 kDa球蛋白apoferritin早得多（图1e）。此外，该蛋白质在SDS-PAGE中以约160 kDa的单条带迁移（图1b），大于其实际的84 kDa。由于用作大小排阻色谱和SDS-PAGE的标准品的球形蛋白质不能直接与非结构化XTEN分子进行比较，因此表观分子量应视为相对值，而不是绝对值。多角度光散射证实了该分子在溶液中的行为与测得分子量接近于计算分子量（分别为65-75 kDa和84 kDa）的单体相同。这些数据一起表明所选的XTEN序列是定义明确的化学物种，在环境条件下在溶液中采用扩展的非结构构象。

。。。。

四、其他 — WO2010091122A1 专利

白蛋白和免疫球蛋白片段（例如Fc区）已用于缀合其他生物活性蛋白质，就半衰期或免疫原性的增加而言，其结果不可预测。不幸的是，Fc结构域在重组表达过程中不能有效折叠，并且倾向于形成称为包涵体的不溶性沉淀。这些包涵体必须被溶解，功能蛋白必须被复性。这是耗时，低效且昂贵的过程，需要额外的制造步骤以及通常复杂的纯化程序。

在一个实施方案中：

本发明提供了包含大于约400至约3000个氨基酸残基的分离的扩展重组多肽（XTEN），
其中XTEN的特征在于甘氨酸（G），丙氨酸（A），丝氨酸（S），苏氨酸（T），谷氨酸（E）和脯氨酸（P）残基的总和构成大于约80％，或约85％，或约90％，或约95％，或约96％，或约97％，或约XTEN序列总氨基酸序列的98％或大约99％，XTEN序列基本上是非重复的，
当通过TEPITOPE算法分析时，XTEN序列缺少预测的T细胞表位，其中TEPITOPE算法可预测内部的表位XTEN序列基于-5或-6或-7或-8或-9或更高的分数，
通过GOR算法确定的coil形成，XTEN序列的得分大于90％，或者大于91％，或者大于92％，或大于93％，或大于94％，或大于95％，或大于96％，或大于96％，或大于98％，或大于99％，并且通过Chou Fasman算法确定的XTEN序列具有不到2％的α螺旋和2％的β-折叠

例子72：通过预测算法分析二级结构的序列

[00593] 可通过某些计算机程序或算法，例如众所周知的Chou-Fasman算法（Chou，PY等人，（1974）Biochemistry，13：222-45）和 Garnier-Osguthorpe-Robson或“ GOR”方法（Gamier J，Gibrat JF，Robson B.（1996）。GOR method for predicting protein secondary structure from amino acid sequence。Methods Enzymol 266：540-553）。对于给定的序列，算法可以预测是否根本存在一些或不存在二级结构，表示为形成该序列的残基的总数和/或百分比，例如，α-螺旋或β-折叠或预测将导致随机线圈形成的序列的残基的百分比。

使用Chou-Fasman和GOR方法的两种算法工具评估了XTEN“家族”的几个代表性序列，以评估这些序列中二级结构的程度。

[00595] 作为分析的第一步，通过两种算法分析了单个XTEN序列。 AE864组合物是一种XTEN，具有864个氨基酸残基，这些残基是由四个12个氨基酸序列基序（由氨基酸G，S，T，E，P和A组成）的多个副本产生的。序列基序的特征在于在基序和整个序列中的重复性是有限的，因为在任何一个12个氨基酸基序中，任何两个连续氨基酸的序列都不会重复两次以上，并且全长XTEN的三个连续氨基酸都不相同。通过ChouFasman和GOR算法分析了N末端AF 864序列的较长部分（后者要求最小长度为17个氨基酸）。通过将FASTA格式序列输入预测工具并运行分析来分析序列。分析结果列于表32。

[00596]结果表明，通过Chou-Fasman计算，AE家族的四个基序（表1）没有α-螺旋或β-折叠。类似地发现多达288个残基的序列没有α-螺旋或β折叠。预测432个残基序列具有少量的二级结构，只有2个氨基酸构成了α-螺旋，占总百分比的0.5％。全长AF864多肽具有构成α-螺旋的相同两个氨基酸，总百分比为0.2％。随机coil形成的计算表明，随着长度的增加，随机coil形成的百分比增加。序列的前24个氨基酸具有91％的无规卷曲形成，随着长度的增加而增加，直至全长序列的99.77％。

还分析了来自其他基序家族的500个或更多个氨基酸的XTEN序列，发现大多数具有大于95％的随机卷曲(coil)形成。例外是那些具有三个或多个连续丝氨酸残基的一个或多个实例的序列，这些序列导致预测的β-折叠形成。但是，即使这些序列仍然具有大约99％的随机线圈形成

相反，通过Chou-Fasman算法评估了仅限于A，S和P氨基酸的84个残基的多肽序列，该算法可预测高比例的α螺旋。具有多个重复的“ AA”和“ AAA”序列的序列，其α-螺旋结构的总预测百分数为69％。 GOR算法预测了78.57％的随机线圈形成；远小于在本实施例中分析的由12个氨基酸序列基序组成的任何序列，这些基序由氨基酸G，S，T，E，P组成

结论：该分析支持以下结论：

由G，S，T，E，P和A的多个序列基序创建的XTEN，这些序列基序对连续氨基酸的重复性有限，预计它们的α-螺旋量非常低和Beta版表；
增加XTEN的长度不会明显增加α-螺旋或β-折叠形成的可能性；
通过添加由氨基酸G，S，T，E，P和A组成的非重复12-聚体逐渐增加XTEN序列的长度，会导致无规卷曲形成的百分比增加。相反，由Chou-Fasman算法确定，由内部氨基酸重复程度较高的，仅限于A，S和P的氨基酸产生的多肽预计具有高百分比的α-螺旋，以及随机形成的螺旋。根据通过这些方法评估的众多序列，通常情况是XTEN是由G，S，T，E，P和A的序列基序创建的，这些基序具有有限的重复性（定义为不超过两个相同的连续氨基酸）预期长度大于约400个氨基酸残基的任何一个基序具有非常有限的二级结构。除含有三个连续丝氨酸的基序外，据信表1中序列基序的任何顺序或组合均可用于产生长度大于约400个残基的XTEN多肽，这将导致XTEN序列基本上是没有二级结构。预期此类序列具有本文公开的本发明的BPXTEN实施方案中描述的特征。

实施例73：多肽序列的重复性分析 Analysis of polypeptide sequences for repetitiveness

[00601] 多肽氨基酸序列的重复性可以通过量化较短的子序列在整个多肽内出现的次数来评估。例如，具有200个氨基酸残基的多肽具有192个重叠的9个氨基酸亚序列（或9聚体“框架”），但是独特的9聚体亚序列的数目将取决于序列内的重复性的量。在本分析中，通过求和在聚合物部分的前200个氨基酸上每个3-氨基酸框架的所有唯一3-mer子序列的出现除以唯一3-mer子序列的绝对数目，来评估不同序列的重复性。在200个氨基酸序列之内。所得的子序列分数(subsequence score)反映了多肽内的重复程度。

结果显示在表33中，表明由2种或3种氨基酸类型组成的非结构化多肽具有较高的亚序列评分(subsequence scores)，而由6种氨基酸G，S，T，E，P，内部重复度较低的A和A的子序列得分小于10，在某些情况下小于5。例如，L288序列具有两种氨基酸类型，并且具有短而高度重复的序列，从而导致了子序列分数为50.0。多肽J288具有三种氨基酸类型，但也具有短的重复序列，导致亚序列得分为33.3。 Y576也具有三种氨基酸类型，但不是由内部重复组成，这反映在前200个氨基酸中的15.7子序列得分中。 W576由四种类型的氨基酸组成，但是具有较高程度的内部重复性，例如“ GGSG”（SEQ ID NO：782），其子序列得分为23.4。 AD576由四种类型的12个氨基酸基序组成，每种基序由四种类型的氨基酸组成。由于各个基序的内部重复性较低，因此前200个氨基酸的总体子序列得分为13.6。相比之下，由四个基序组成的XTEN’s包含六种氨基酸，每种氨基酸的内部重复性较低，其子序列得分较低；即AE864（6.1），AF864（7.5）和AM875（4.5）。

结论：结果表明，将12个氨基酸亚序列基序组合成更长的XTEN多肽，每个基序由4至6个基本上非重复的氨基酸类型组成，从而导致整体序列不重复。尽管事实是每个子序列基序可以在序列中多次使用。相反，由较少数量的氨基酸类型产生的聚合物导致较高的子序列得分，尽管可以对实际序列进行定制以减少重复程度，从而导致较低的子序列得分

Example 74: Calculation of TEPITOPE scores

略

CLAIMS

一种分离的扩展重组多肽（XTEN，extended recombinant polypeptide），其包含大于约400至约3000个氨基酸残基，其中所述XTEN的特征在于：

甘氨酸（G），丙氨酸（A），丝氨酸（S），苏氨酸（T），谷氨酸（E）和脯氨酸（P）的总和构成该氨基酸总氨基酸序列的80％以上 XTEN;
XTEN序列基本上是非重复的；
当通过TEPITOPE算法分析时，XTEN序列缺乏预测的T细胞表位，其中TEPITOPE算法对XTEN序列内的表位的预测是基于-9或更高的分数。
通过GOR算法确定的XTEN序列具有大于90％的随机线圈形成；和
根据Chou-Fasman算法确定，XTEN序列的α螺旋少于2％，β折叠少于2％

参考资料

A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner

药企，独角兽，苏州。团队长期招人，感兴趣的都可以发邮件聊聊：tiehan@sina.cn

个人公众号，比较懒，很少更新，可以在上面提问题，如果回复不及时，可发邮件给我： tiehan@sina.cn