我需要将静态内容网站迁移到。基本上,我们有大量的HTML页面。还有很多Word和PDF文档是从HTML页面引用的。
我们需要使用爬虫提取内容,然后集成而不是将数据导入到。
成功完成这一迁移的最佳实践是什么?
IBM中有批量导入功能吗?
是否可以通过某种API或服务自动化创建页面和组件的过程?
如何批量导入Word文档和PDF,将其存储为可从迁移页面引用的组件。致以问候。
发布于 2014-05-28 21:19:54
要导入内容,可以尝试两个选项:
要创建门户页面/组件(如图像、文件、html),您还可以使用Portal/WCM。但是在导入内容之前,请确保您消除了内容和内容之间的差异,并决定了您想要创建的内容源( conent或compoentns )。此外,关于创建页面编程的信息也较少,但这是可能的。
如果计划使用JSR286portlet来显示contnet,请查看。这样,您就可以自动化您的配置,并避免手动提交给每个页面。页面混合-它只是xml文件,您总是可以用java修改这个文件,并将更新的文件应用于特定的页面。
更新
以编程方式创建门户页
import com.ibm.portal.ModifiableMetaDataProvider;
import com.ibm.portal.content.*;
import com.ibm.portal.model.ContentModelHome;
import com.ibm.portal.model.ContentModelProvider;
import com.ibm.portal.model.controller.ContentModelControllerHome;
import com.ibm.portal.model.controller.CreationContextBuilderFactory;
import com.ibm.portal.model.controller.exceptions.CannotInstantiateControllerException;
import com.ibm.workplace.wcm.services.addressability.FriendlyURLFactoryImpl;
import com.ibm.wps.pe.pc.std.core.PortletUtils;
import javax.naming.Context;
import javax.naming.InitialContext;
import javax.portlet.*;
/**
* @author : Georgy Gobozov
* @created : 12.03.13
*/
public class PageUtil {
private static final String PREF_PARENT_PAGE = "parent.page.unique.name";
private static final String PREF_UNIQUE_PREFIX = "pages.unique.name.prefix";
public static boolean createPortalPage(String title, ActionRequest request, ActionResponse response) {
PortletPreferences prefs = request.getPreferences();
String parentPageUniqueName = prefs.getValue(PREF_PARENT_PAGE, "wps.content.root");
String uniqueNamePrefix = prefs.getValue(PREF_UNIQUE_PREFIX, "study.portal.pages.");
ContentModelController ctrl = null;
CreationContextBuilderFactory factory = null;
ContentPageCreationContext ctx = null;
ModifiableContentPage newPage = null;
ContentNode parent = null;
try {
ctrl = getController(request, response);
factory = CreationContextBuilderFactory.getInstance();
// Use the context to create the private page
ctx = factory.newContentPageCreationContext(true);
newPage = (ModifiableContentPage) ctrl.create(ContentPage.class, ctx);
newPage.setTitle(request.getLocale(), title);
// set page unique name
newPage.getModifiableObjectID().setUniqueName(uniqueNamePrefix + title);
parent = (ContentNode) ctrl.getLocator().findByUniqueName(parentPageUniqueName);
if (parent != null) {
ctrl.insert(newPage, parent, null);
// set friendly name
ModifiableMetaDataProvider mmdp = (ModifiableMetaDataProvider)ctrl.getModifiableNode(newPage);
mmdp.getModifiableMetaData().setValue("com.ibm.portal.friendly.name", title);
// Commit, i. e. persist the changes.
ctrl.commit();
}
} catch (Exception e) {
e.printStackTrace();
} finally {
if (null != ctrl)
// Dispose the Controller.
ctrl.dispose();
}
return true;
}
public static ContentModelController getController(PortletRequest request, PortletResponse response) {
ContentModel aContentmodel = null;
ContentModelController ctrl = null;
ContentModelControllerHome home = null;
try {
Context ictx = new InitialContext();
ContentModelHome homea = (ContentModelHome) ictx.lookup("portal:service/model/ContentModel");
if (homea != null) {
ContentModelProvider provider = homea.getContentModelProvider();
PortletUtils.getInternalRequest(request).getHttpServletRequest();
//aContentmodel = provider.getContentModel((ServletRequest) request, (ServletResponse) response);
aContentmodel = provider.getContentModel(PortletUtils.getInternalRequest(request).getHttpServletRequest(), PortletUtils.getInternalResponse(response).getHttpServletResponse());
}
home = (ContentModelControllerHome) ictx.lookup(ContentModelControllerHome.JNDI_NAME);
if (home != null) {
try {
ctrl = home.getContentModelControllerProvider().createContentModelController(aContentmodel);
} catch (CannotInstantiateControllerException e) {
e.printStackTrace();
}
}
} catch (Exception e) {
e.printStackTrace();
}
return ctrl;
}
}更有用的类这里
https://stackoverflow.com/questions/23908858
复制相似问题