A conferencia de innovación de rede de rede AI 2023 celebrada no modelo de rede intelixente de Pequín no BBS, o modelo de produtos de cable ZTE Modelo Ji'an-Guo Lu fixo a rede de sabedoría New Era: Big Model impulsar o futuro do tema do ZTE a través dun modelo de dirección direccional de gran tamaño para mellorar a calidade intelixente do corpus e usar o nivel de datos intelixentes do corpus.
Lu Jianguo dixo que moitas tecnoloxías clave, como a IA habilitante, o xemelgo dixital e a intención, apoiarán o nivel de intelixencia da rede de autointelixencia de L4 a L5 e farán que a rede de autointelixencia continúe iterando e evoluciona para completar a autointelixencia. Entre estas tecnoloxías clave, a IA é o motor máis importante e os grandes modelos son a clave da tecnoloxía AI.
En Como aplicar un gran modelo á rede de auto-intelixencia, Lu Jianguo introduciu ese gran modelo ten capacidade de super xeración e pode xerar rapidamente un gran número de esquemas. Para as operacións de rede intelectual, unha necesidade de implementar un gran número de pasos de operación, equivalentes ao espazo de alta dimensión para atopar a solución óptima, solución de solución para todos os procesos posibles, un gran modelo para solucións xerais como o problema de NP (non polinómico), un gran número de mostras, avaliación, optimización, iteración pode xogar a poda eficiente, abordar rapidamente a solución optimal. Non obstante, aínda que os grandes modelos xeran moitos esquemas, é difícil asegurarse de que estes esquemas sexan útiles. Aínda que os modelos grandes teñen certa capacidade de pensamento, aínda precisan intervención humana cando se trata dunha lóxica complexa. Para resolver este problema, ZTE suxire integrar experiencia experta no proceso de pre-adestramento incremental e afinación fina do modelo para formar unha iteración en bucle pechado. Deste xeito, pódese realizar unha transición suave da aprendizaxe de reforzo de retroalimentación manual para a aprendizaxe de reforzo de retroalimentación de ferramentas, que pode utilizar efectivamente a capacidade de xeración de grandes modelos por unha banda e, por outra banda, asegurarse de que o esquema de diagnóstico xerado sexa preciso e fiable. Neste esquema, é unha ligazón clave para construír o mapa de coñecemento e mantemento combinado coa enxeñaría do coñecemento. A xeración do esquema de volantes de datos baséase no mapa de coñecemento de operación e mantemento, para evitar a ilusión do modelo e garantir a fiabilidade e precisión do esquema de xeración. Este enfoque baseado en gráficos de coñecemento pode integrar mellor a experiencia de expertos e as capacidades de xeración de modelos para ofrecer solucións máis fiables.
Para o deseño da lóxica da aplicación do gran modelo, Lu Jianguo introduciu ademais que ZTE adoptará o método de bucle pechado baseado no modelo baseado na enxeñaría rápida. A esencia do deseño é tomar a expresión estruturada da linguaxe humana (plantilla rápida) como entrada, xerar a saída estruturada (esquema de arranxo) a través do modelo grande e, finalmente, combinar a execución interactiva do marco da aplicación. Para realizar a lóxica anterior, ZTE fará preparados técnicos a partir de moitos aspectos, como a evolución da capacidade multimodal, a preparación do corpus, o coñecemento de relacións de recursos, a inxección de coñecemento de gráficos, a API atómica do corpus Reserve / Reserva de capacidade atómica da API, a construción do ambiente de falla de simulación de simulación de xemelgos dixital e a preparación de ferramentas.
Lu Jianguo finalmente dixo que o principal valor do gran modelo reside na súa capacidade de emerxencia, é dicir, pode xerar innovación combinando o coñecemento existente. Non obstante, a realización desta capacidade emerxente depende da produción, aceptación e precipitación de datos de alta calidade. Un ciclo virtuoso de datos é o factor determinante.
Tempo de publicación: novembro-20-2023